ジョイン

このオペレーターは、ユーザーがエイリアス、出力カラム、ジョイン条件などの入力データセットを定義できるようにすることで、データセットをジョインします。

ジョインオペレーター

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

入力

入力には 2 つ以上のデータセットが必要です。

ノート: 現在のリリースの場合 (7.1.0)、最大 2 つのデータセットが入力として受け入れられます。

両方のテーブルが同じデータベースに存在する必要があります。ジョインは、異なるデータベースにあるテーブルでは機能しません。ジョイン オペレーターに関するデータ ソースの例外については、「TIBCO Data Science - Team Studio オペレーターとデータ ソースの互換性」を参照してください。

不正な値または欠落している値
Null 値は許されず、エラーとなります 。

構成

次の表に、ジョイン オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
シーケンス ID の作成 [はい] をクリックして、ジョイン オペレーターの出力データセットに ID カラムを作成します。
ジョイン条件 [ジョイン条件の定義] をクリックして、ジョイン プロパティ ダイアログを表示します。詳細については、「ジョイン プロパティ - データベース ダイアログ」を参照してください。

ジョイン条件の作成については、「データベース ジョインのジョイン条件の作成」を参照してください。

出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
  • 出力: ジョインされたデータセットの出力を表示するテーブル。

次の例では、ジョイン オペレーターを使用して、golf データセットと golf-1 データセットを 1 つのデータセットにジョインします。

オペレーターのワークフローに参加する
データ

golf: このデータセットには次の情報が含まれています。

  • 複数のカラム、ここでは 天気概況、気温、風、湿度、プレー
  • 複数行 (14 行)

golf-1: このデータセットには次の情報が含まれています。

  • 複数のカラム、ここでは 天気概況、気温、風、湿度、プレー
  • 複数行 (14 行)

パラメーター設定
golf および golf-1 データセットのパラメーター設定は次のとおりです。
  • シーケンス ID の作成: いいえ

  • ジョイン条件: 天気概況、気温、湿度、風

  • 結果を保存: はい

出力
次の図は、指定されたデータセットのパラメーター設定の出力を示しています。
ジョイン オペレーターの出力