箱ひげ図 (Box Plot)

データセットの属性を箱ひげ図形式で視覚化します。

箱ひげ図オペレーターのアイコン

情報一覧

パラメーター

説明
カテゴリー エクスプローラ
データ ソース タイプ DB、HD
出力を他のオペレーターに送信 いいえ
データ処理ツール Pig

このオペレーターを使用して、箱ひげ図を使用してデータセットの属性のグラフィカル表現を作成します。

各ボックスアンドウィスカーには、以下が適用されます。

  • ボックスの下部と上部は、データの 25 パーセンタイルと 75 パーセンタイルを示します。
  • ボックスの中央のバンドは、50 パーセンタイル (中央値) を示します。
  • ひげの下部と上部は、データセット内の最小値と最大値を表します。
  • 平均は小さな円で示されます。

箱ひげ図オペレーターを使用すると、データ テーブルで次の 3 つの属性 (列) を選択できます。

  • X 軸 (分析タイプ) - 箱ひげ図の X 軸を構築するためのカテゴリー タイプ属性を受け入れます。
  • Y 軸 (分析値) - 箱ひげ図の Y 軸を構築するための数値属性を受け入れます。
  • グループ・バイされたディメンション (分析シリーズ) - カテゴリー タイプの属性を受け入れます。これは、異なる色の図で表示されます。

入力

前のオペレーターからのデータセット。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
分析シリーズ グループのカテゴリ列。
分析タイプ (X 軸) X 軸のカテゴリ列。
解析値(Y軸) Y 軸の数値列。
近似を使用する (高速) 近似を使用するかどうかを指定します - [はい] (デフォルト) または [いいえ]

出力

ビジュアル出力
箱ひげ図。
データ出力
なし。これはターミナル オペレーターです。

次の例は、延滞/非延滞クレジット顧客 (AnalysisType) の月収 (Analysis Value) を 90 日の延滞回数 (Analysis Series) ごとにグループ・バイして示しています。

箱ひげ図の例