DISTINCT (DB)
データベース ソースの指定されたカラムから値の異なる組み合わせのみを返します。行は特定の順序で返されるわけではありませんが、行内の値の各組み合わせは他の行とは異なります。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降を使用するワークフローでも使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | DB |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | SQL |
ノート: DISTINCT (DB) オペレーターはデータベース データのみに使用されます。Hadoop データの場合は、Disctinct (HD) オペレーターを使用します。
入力
データベースソース。ユーザーが個別の組み合わせが必要なカラムを選択すると、オペレーターが計算を実行します。
値が不正または欠落しています
欠損値は、個別の値の決定の一部として考慮されます。列に欠損値がある場合、欠損値は値とは別のものとみなされます。
このオペレーターは、入力計算から Null 値を除外することによって、Null 値を処理します。この動作を防ぐには、最初のトレーニング データに対して Null 値置換 (DB) オペレーターを使用して、不正な値または欠落している値を置き換えます。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 個別のカラム
*必須 |
データ行の生成に使用するデータ ソースから 1 つ以上のカラムを選択します。各行には列値の個別の組み合わせが含まれます。 |
| 出力タイプ |
|
| 出力スキーマ | 出力テーブルまたはビューのスキーマ。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 存在する場合は削除 | 既存のテーブルを上書きするかどうかを指定します。
|
出力
データ出力
選択されたカラムのみを含むデータのサブセット。各行はそれらのカラムの値の個別の組み合わせのみを含みます。
