ピボット (DB)

同じリスト内の別のカラムで定義されている小計 (またはその他の計算) を使用して、テーブルのカラムに含まれるカテゴリーデータを新しいテーブルのカラムに変換できます。他の計算は平均とカウントである可能性があります。

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降を使用するワークフローでも使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ DB
出力を他のオペレーターに送信 はい
データ処理ツール なし

ノート: ピボット (DB) オペレーターはデータベース データのみを対象とします。Hadoop データの場合は、ピボット (HD) オペレーターを使用します。

アルゴリズム

一般的なデータ入力と保存では、データは通常、フラット テーブルに表示されます。これは、データがカラムと行のみで構成されていることを意味します。このようなデータには多くの情報が含まれている可能性がありますが、要約された情報を取得するのが難しい場合があります。ピボット テーブルは、フラットなデータをすばやく要約し、データに深みを与え、必要な情報を強調表示するのに役立ちます。

ピボット テーブルの用途は非常に幅広く、状況に応じて異なります。最初に尋ねる質問は「何を探しているのですか?」です。ピボット テーブルは通常、行、カラム、データ (またはファクト) フィールドで構成されます。これらのフィールドでは、合計、平均、カウント、最大、最小など、数種類の集計が可能です。

ピボット カラムは通常、カテゴリー カラムであり、出力テーブルではカテゴリごとに 1 つずつ複数のカラムに変換されます。

  • 結果は、選択したカラムによってもグループ・バイされます。
  • 新しいカラムの値は、3 番目のカラム (または、集計カラムが選択されていない場合はカテゴリの存在) の集計です。
  • カラムは、(テーブル、ファイル、または配列内で) それらが表すカテゴリの値の降順でリストされます。

ノート: このオペレーターは、特定の状況でのみ後続のオペレーターに接続できます。詳細については、以下の「出力」セクションを参照してください。

入力

前のオペレーターからのデータセット。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
ピボット カラム ピボット変換のカラム。データベース データ ソースでは、ピボットするカテゴリー カラムのみを選択できます。
グループ・バイ グループ・バイするカラム。
集計カラム ピボットカラムの値カラム。
集計 集計関数。オプション:

  • Sum
  • Average
  • Count
  • Max
  • Min

配列を使用 出力の形式。

  • 配列を使用するには、[配列を使用] チェックボックスをオンにします。このオプションは非終端です。
  • 配列を使用しない場合は、[配列を使用] チェックボックスをオフにします。このオプションはターミナルです。

デフォルト値: false

出力タイプ
  • [テーブル] はデータベース テーブルを出力します。 [テーブル] を指定すると、[ストレージ パラメーター] が有効になります。
  • [ビュー] はデータベース ビューを出力します。
出力スキーマ 出力テーブルまたはビューのスキーマ。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
ストレージ パラメーター オペレーター出力の詳細なデータベース設定。 [テーブル] 出力でのみ使用できます。

詳細については、「ストレージ パラメーター ダイアログ」を参照してください。

存在する場合は削除 既存のテーブルを上書きするかどうかを指定します。
  • はい - その名前のテーブルが存在する場合、結果を保存する前にテーブルが削除されます。
  • いいえ - その名前のテーブルが存在する場合、結果ウィンドウにエラー メッセージが表示されます。

出力

ビジュアル出力
[配列を使用] が [true] の場合、ピボットされた値は 1 つのカラムの配列に格納されます。

配列内の値は、それらが表すカテゴリの値の降順に配置されます。

[配列を使用] が [false] の場合、またはオペレーターが Hadoop データセットを操作している場合、ピボットされた値はそれぞれ独自のカラムに配置されます。

データ出力

[配列を使用する] が [true] の場合、新しく作成されたテーブルまたはビューのデータセットが後続のオペレーターに出力されます。それ以外の場合、出力は送信されません。

以下に示す生の食料品データは、ピボット オペレーターを使用して、ワインが販売されたときと販売されなかったときに販売されたビールの数のサマリー テーブルにすぐに変換できます。