ジョイン
このオペレーターは、ユーザーがエイリアス、出力カラム、ジョイン条件などの入力データセットを定義できるようにすることで、データセットをジョインします。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
入力
入力には 2 つ以上のデータセットが必要です。
ノート: 現在のリリースの場合 (7.1.0)、最大 2 つのデータセットが入力として受け入れられます。
両方のテーブルが同じデータベースに存在する必要があります。ジョインは、異なるデータベースにあるテーブルでは機能しません。ジョイン オペレーターに関するデータ ソースの例外については、「TIBCO Data Science - Team Studio オペレーターとデータ ソースの互換性」を参照してください。
不正な値または欠落している値
Null 値は許されず、エラーとなります 。
構成
次の表に、ジョイン オペレーターの構成の詳細を示します。
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| シーケンス ID の作成 | [はい] をクリックして、ジョイン オペレーターの出力データセットに ID カラムを作成します。 |
| ジョイン条件 | [ジョイン条件の定義] をクリックして、ジョイン プロパティ ダイアログを表示します。詳細については、「ジョイン プロパティ - データベース ダイアログ」を参照してください。 ジョイン条件の作成については、「データベース ジョインのジョイン条件の作成」を参照してください。 |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
出力
ビジュアル出力
- 出力: ジョインされたデータセットの出力を表示するテーブル。
例
次の例では、ジョイン オペレーターを使用して、golf データセットと golf-1 データセットを 1 つのデータセットにジョインします。
データ
golf: このデータセットには次の情報が含まれています。
- 複数のカラム、ここでは 天気概況、気温、風、湿度、プレー
- 複数行 (14 行)
golf-1: このデータセットには次の情報が含まれています。
- 複数のカラム、ここでは 天気概況、気温、風、湿度、プレー
- 複数行 (14 行)
パラメーター設定
golf および golf-1 データセットのパラメーター設定は次のとおりです。
-
シーケンス ID の作成: いいえ
-
ジョイン条件: 天気概況、気温、湿度、風
-
結果を保存: はい
出力
次の図は、指定されたデータセットのパラメーター設定の出力を示しています。