セット オペレーション

このオペレーターは、2 つ以上のクエリを結合した結果を 1 つの結果セットに結合します。

設定操作のオペレーター アイコン

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

入力

入力として使用される表形式のデータセットが 2 つ以上存在する必要があります。

ノート: 現在のリリースの場合 (7.1.0)、最大 2 つのデータセットが入力として受け入れられます。

制限事項

  • カラムの数はすべてのクエリで同じである必要があります。
  • データ タイプには互換性がある必要があります。

構成

次の表に、セット オペレーション オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
セット セットの定義をクリックして、セットの定義ダイアログを表示します。詳細については、「セットの定義ダイアログ」を参照してください。
出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
出力テーブルのデータ行を表示するテーブル。行とカラムの最大表示数によって制限されます。
データ出力
ジョインされたデータセットを表示する表形式のデータセット。

次の例は、クエリの結果を単一の結果セットに結合する セット オペレーション オペレーターを示しています。ここでは、ユニオン内のすべてのクエリに属するすべての個別の行が含まれます。

セット オペレーションオペレーターのワークフロー
データ
クレジット: このデータセットには次の情報が含まれています。
  • 複数のカラム、名称は、id、times90dayslate、revolving_util、debt_ratio、credit_lines、monthly_income、times30dayslate_2years、および srsdlqncy。
  • 複数行 (50,000 行)。
クレジットデータセット
デモグラフィック: このデータセットには次の情報が含まれています。
  • 複数のカラム、名称は、ID、AGE_IN_YEARS、LEVEL_OF_EDUCATION、YEARS_WITH_CURRENT_EMPLOYER、および YEARS_AT_CURRENT_ADDRESS。
  • 複数行 (850 行)。
デモグラフィック データセット
パラメーター設定
セット オペレーターのパラメーター設定は次のとおりです。
  • セット: UNION

    エイリアス クレジット デモグラフィック
    NEW_ID id ID
  • 結果を保存: はい

出力
次の図は、セット オペレーション オペレーターの出力を示しています。結果には、使用された両方のデータセット内のすべての一意の識別子 (ID) が表示されます。
集合演算のオペレーターの出力