ピボット
このオペレーターは、同じリスト内の別のカラムで定義できる小計 (またはその他の計算) を使用して、テーブルのカラムに含まれるカテゴリーデータを新しいテーブルのカラムに変換します。他の計算には平均とカウントを使用できます。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
アルゴリズム
一般的なデータ入力とストレージでは、データは通常、行とカラムのみで構成されるフラット テーブルに表示されます。このようなデータには多くの情報が含まれていますが、情報のサマリーを取得するのが難しい場合があります。ピボット テーブルは、フラットなデータを素早く要約し、データに深みを与え、必要な情報を強調表示するのに役立ちます。
ピボット テーブルの用途は非常に幅広く、状況に応じて異なります。最初の質問は「何を探していますか?」です。ピボット テーブルは通常、行、カラム、データ (またはファクト) フィールドで構成されます。これらのフィールドでは、合計、平均、カウント、最大、最小など、数種類の集計が可能です。
ピボット カラム はカテゴリのみにすることができます。出力テーブルでは、ピボット カラム がカテゴリごとに 1 つずつ、複数のカラムに変換されます。このオペレーターを実行するには、カテゴリカル データ タイプの変数を少なくとも 1 つ定義する必要があります。
- 結果は、選択したカラムによってもグループ・バイされます。
- 新しいカラムの値は、3 番目のカラム (または、集計カラムが選択されていない場合はカテゴリの存在) の集計です。
- カラムは、(テーブル、ファイル、または配列内で) それらが表すカテゴリの値の降順でリストされます。
入力
入力は単一の表形式のデータセットです。
構成
次の表に、ピボット オペレーターの構成の詳細を示します。
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| ピボット カラム | ピボット変換のカラムを指定します。データベース データ ソースでは、ピボットするカテゴリー カラムのみを選択できます。 |
| グループ・バイ | グループ・バイするカラムを指定します。 |
| 集計カラム | ピボット カラムの値カラムを指定します。 |
| 集計 | 集計関数を指定します。次の値が使用可能です。
|
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
例
次の例は、ピボットオペレーターを示しています。
- 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
- 複数行 (14 行)。
-
ピボット カラム: 再生
-
グループ・バイ: 天気概況
-
集計カラム: 温度
-
集計: 合計
-
結果を保存: はい