頻度

テーブル内の選択したフィールドの値を分析し、データの形状をカラムごとに解釈するのに役立ちます。

頻度オペレーター

情報一覧

パラメーター

説明
カテゴリー エクスプローラ
データ ソース タイプ DB、HD
出力を他のオペレーターに送信 いいえ
データ処理ツール Pig

アルゴリズム

頻度分析は、カラムの各値の数やパーセンテージなど、データの個別の値に関する統計を提供します。

入力

前のオペレーターからのデータセット。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
カラム [カラムの選択] をクリックして、分析に使用できる入力データセットからカラムを選択します。詳細については、「カラムの選択ダイアログ」を参照してください。

ノート: 通常、各 ID 値の頻度は定義上 1 であるため、一意のテキスト (名前) 列または ID 列に対して頻度分析を実行することは意味がありません。

出力

ビジュアル出力
カウント
分析対象として選択したデータ列 (名前) の各個別値のカウントに関する形状分析グラフを表示します。名前のドロップダウン リストからカラムを選択して、分析されたカラムの頻度結果を表示します。
重要: このオペレーターで使用できる視覚化の詳細については、「ビジュアル結果を精査する」を参照してください。
データ
次の例に示すように、選択した各カラム (名前) のカラム名、値、数、頻度パーセンテージが表示されます。

データ出力
なし。これはターミナル オペレーターです。

次の例は、さまざまな教育レベルの頻度数を表示する形状分析グラフを示しています。