ピボット

このオペレーターは、同じリスト内の別のカラムで定義できる小計 (またはその他の計算) を使用して、テーブルのカラムに含まれるカテゴリーデータを新しいテーブルのカラムに変換します。他の計算には平均とカウントを使用できます。

ピボットオペレーターのアイコン

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

アルゴリズム

一般的なデータ入力とストレージでは、データは通常、行とカラムのみで構成されるフラット テーブルに表示されます。このようなデータには多くの情報が含まれていますが、情報のサマリーを取得するのが難しい場合があります。ピボット テーブルは、フラットなデータを素早く要約し、データに深みを与え、必要な情報を強調表示するのに役立ちます。

ピボット テーブルの用途は非常に幅広く、状況に応じて異なります。最初の質問は「何を探していますか?」です。ピボット テーブルは通常、行、カラム、データ (またはファクト) フィールドで構成されます。これらのフィールドでは、合計、平均、カウント、最大、最小など、数種類の集計が可能です。

ピボット カラム はカテゴリのみにすることができます。出力テーブルでは、ピボット カラム がカテゴリごとに 1 つずつ、複数のカラムに変換されます。このオペレーターを実行するには、カテゴリカル データ タイプの変数を少なくとも 1 つ定義する必要があります。

  • 結果は、選択したカラムによってもグループ・バイされます。
  • 新しいカラムの値は、3 番目のカラム (または、集計カラムが選択されていない場合はカテゴリの存在) の集計です。
  • カラムは、(テーブル、ファイル、または配列内で) それらが表すカテゴリの値の降順でリストされます。

ノート: このオペレーターは、特定の状況でのみ後続のオペレーターに接続できます。詳細については、「出力」セクションを参照してください。

入力

入力は単一の表形式のデータセットです。

不正な値または欠落している値
Null 値は許されず、エラーとなります 。

構成

次の表に、ピボット オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
ピボット カラム ピボット変換のカラムを指定します。データベース データ ソースでは、ピボットするカテゴリー カラムのみを選択できます。
グループ・バイ グループ・バイするカラムを指定します。
集計カラム ピボット カラムの値カラムを指定します。
集計 集計関数を指定します。次の値が使用可能です。

  • Sum
  • Average
  • Count
  • Max
  • Min

出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
  • 出力: 後続のオペレーターのデータセットの出力を表示するテーブル。

次の例は、ピボットオペレーターを示しています。

ピボットワークフロー
データ
golf: このデータセットには次の情報が含まれています。
  • 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
  • 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
  • ピボット カラム: 再生

  • グループ・バイ: 天気概況

  • 集計カラム: 温度

  • 集計: 合計

  • 結果を保存: はい

出力
次の図は、golf データセットのパラメーター設定の出力を示しています。
ピボット出力タブ