箱ひげ図 (Box Plot)
データセットの属性を箱ひげ図形式で視覚化します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | エクスプローラ |
| データ ソース タイプ | DB、HD |
| 出力を他のオペレーターに送信 | いいえ |
| データ処理ツール | Pig |
このオペレーターを使用して、箱ひげ図を使用してデータセットの属性のグラフィカル表現を作成します。
各ボックスアンドウィスカーには、以下が適用されます。
- ボックスの下部と上部は、データの 25 パーセンタイルと 75 パーセンタイルを示します。
- ボックスの中央のバンドは、50 パーセンタイル (中央値) を示します。
- ひげの下部と上部は、データセット内の最小値と最大値を表します。
- 平均は小さな円で示されます。
箱ひげ図オペレーターを使用すると、データ テーブルで次の 3 つの属性 (列) を選択できます。
- X 軸 (分析タイプ) - 箱ひげ図の X 軸を構築するためのカテゴリー タイプ属性を受け入れます。
- Y 軸 (分析値) - 箱ひげ図の Y 軸を構築するための数値属性を受け入れます。
- グループ・バイされたディメンション (分析シリーズ) - カテゴリー タイプの属性を受け入れます。これは、異なる色の図で表示されます。
入力
前のオペレーターからのデータセット。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 分析シリーズ | グループのカテゴリ列。 |
| 分析タイプ (X 軸) | X 軸のカテゴリ列。 |
| 解析値(Y軸) | Y 軸の数値列。 |
| 近似を使用する (高速) | 近似を使用するかどうかを指定します - [はい] (デフォルト) または [いいえ]。 |
出力
ビジュアル出力
箱ひげ図。
データ出力
なし。これはターミナル オペレーターです。
例
次の例は、延滞/非延滞クレジット顧客 (AnalysisType) の月収 (Analysis Value) を 90 日の延滞回数 (Analysis Series) ごとにグループ・バイして示しています。