DISTINCT
このオペレーターは、データベース ソースの特定のカラムからの値の異なる組み合わせのみを返します。行は特定の順序で返されるわけではありませんが、行内の値の各組み合わせは他の行とは異なります。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
入力
入力は単一の表形式のデータセットです。個別の組み合わせを作成するカラムを選択すると、オペレーターが計算を実行します。
不正な値または欠落している値
欠損値は、個別の値の決定の一部として考慮されます。カラムに欠損値がある場合、その欠損値は値とは別のものとみなされます。
このオペレーターは、入力計算から Null 値を除外することによって、Null 値を処理します。この動作を防ぐには、初期トレーニング データに対して Null 値置換 オペレーターを使用して、不正な値、または欠落している値を置き換えます。
構成
次の表に、DISTINCT オペレーターの構成の詳細を示します。
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 個別のカラム | データ行の生成に使用するデータ ソースのカラムを指定します。各行にはカラム値の個別の組み合わせが含まれます。 |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
出力
ビジュアル出力
データセットの選択されたカラムからの値の個別の組み合わせを表示するテーブル。
後続オペレーターへの出力
特定のカラムの値を個別に組み合わせた単一の表形式のデータセット。
例
次の例は、DISTINCT オペレーターを示しています。
データ
golf: このデータセットには次の情報が含まれています。
- 複数のカラム、ここでは 天気概況、気温、風、湿度、プレー。
- 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
-
個別のカラム: 天気概況、プレー
-
結果を保存: はい
出力
次の図は、golf データセットのパラメーター設定の出力を示しています。