アンピボット (DB)
1 つ以上のカラムをアンピボットします。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降を使用するワークフローでも使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | DB |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | SQL |
ノート: アンピボット (DB) オペレーターはデータベース データのみを対象とします。Hadoop データの場合は、アンピボット (HD) オペレーターを使用します。
選択されたカラムは入力から削除され、出力データセットの最後で次の 2 つの新しいカラムに平坦化されます。
- 最初の列。その値は選択したカラムの名前です。
- 2 番目の列。その値は、選択したカラムの対応する値です。
入力
データベースからのデータセット。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 列 | アンピボットする列。すべてのデータ タイプがサポートされています。 |
| 変数カラムの名前 | 最初の新しいカラムの名前。これには、アンピボットするカラムの名前が含まれます。 ノート: 値は英数字である必要があります。 (一致する正規表現は次のとおりです: "^[A-Za-z]+ \\ w*$") |
| 値カラムの名前 | 2 番目の新しいカラムの名前。これには、アンピボットするカラムの値が含まれます。 ノート: 値は英数字である必要があります。 (一致する正規表現は次のとおりです: "^[A-Za-z]+ \\ w*$") |
| 出力タイプ |
|
| 出力スキーマ | 出力テーブルまたはビューのスキーマ。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 存在する場合は削除 | 既存のテーブルを上書きするかどうかを指定します。
|
出力
Y 列と N 行の入力からアンピボットする X カラムを選択した場合、出力データセットには (Y-X+2) 列と (X * N) 行が含まれます。
データ出力
ノート:
- 「新しい変数」列には、ピボットされていない値の名前が chararray 形式で含まれています。
- 新しい値カラムの場合:
- アンピボットするために選択されたすべてのカラムが数値の場合、結果の値列はダブルになります。
- アンピボットするために選択されたすべてのカラムがまったく同じ形式の日時vである場合、結果の値列は同じ形式の日時になります。
- 他のすべての場合、結果の値列は chararray になります。
- すべての Null 値は出力に保持されます。
例
| 名前 | 数学 | 化学 | 英語 |
|---|---|---|---|
| ジョン | 90 | 70 | 50 |
| マット | 60 | 50 | 80 |
ピボットを解除する数学、科学、英語のカラムを選択し、主題と学年という名前の新しいカラムを指定すると、結果は次のようになります。
| 名前 | 科目 | 学年 |
|---|---|---|
| ジョン | 数学 | 90 |
| ジョン | 化学 | 70 |
| ジョン | 英語 | 50 |
| マット | 数学 | 60 |
| マット | 化学 | 50 |
| マット | 英語 | 80 |