アンピボット
このオペレーターは、カラムのリストとともに 1 つ以上のカラムを受け入れ、リストで指定されたカラムごとに行を生成します。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
選択したカラムは入力から削除され、出力データセットの最後で次の 2 つの新しいカラムに変換されます。
- 最初のカラム - 値は選択したカラムの名前です。
- 2 番目のカラム - 値は、選択したカラムの対応する値です。
入力
入力は単一の表形式のデータセットです。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| カラム | アンピボットするカラムを指定します。すべてのデータ タイプがサポートされています。 |
| 変数カラムの名前 | 最初の新しいカラムの名前を指定します。これには、アンピボットするカラムの名前が含まれます。 ノート: 値は英数字である必要があります。 (一致する正規表現は次のとおりです: "^[A-Za-z]+ \\ w*$") |
| 値カラムの名前 | 2 番目の新しいカラムの名前を指定します。これには、アンピボットするカラムの値が含まれます。 ノート: 値は英数字である必要があります。 (一致する正規表現は次のとおりです: "^[A-Za-z]+ \\ w*$") |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
出力
Y カラムと N 行の入力からアンピボットする X カラムを選択した場合、出力データセットには (Y-X+2) カラムと (X * N) 行。
ビジュアル出力
カラムのピボットを解除した後のデータセットの出力を表示するテーブル。
データ出力
新しく作成されたテーブルまたはビューの表形式のデータセット。
ノート:
- 新しい変数 カラムには、ピボットされていない値の名前が
chararray形式で含まれています。 - 次の条件が 新しい値 カラムに適用されます。
- アンピボットするために選択されたすべてのカラムが数値の場合、結果の値カラムは
ダブルになります。 - アンピボットするために選択されたすべてのカラムがまったく同じ形式の
日時形式である場合、結果の値カラムは同じ形式の日時形式になります。 - それ以外のすべての場合、結果の値カラムは
chararrayになります。
- アンピボットするために選択されたすべてのカラムが数値の場合、結果の値カラムは
- すべての Null 値は出力に保持されます。
例
次の例では、カラムのピボットを解除し、アンピボット オペレーターを使用して新しいテーブルを形成することによって作成されたデータセットを表示します。
データ
golf: このデータセットには次の情報が含まれています。
- 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
- 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
-
カラム: 湿度、温度
-
変数カラムの名前: Variable_Column
-
値カラムの名前: Value_Column
-
結果を保存: はい
出力
次の図は、golf データセットのパラメーター設定の出力を示しています。