DISTINCT (DB)

データベース ソースの指定されたカラムから値の異なる組み合わせのみを返します。行は特定の順序で返されるわけではありませんが、行内の値の各組み合わせは他の行とは異なります。

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降を使用するワークフローでも使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ DB
出力を他のオペレーターに送信 はい
データ処理ツール SQL

ノート: DISTINCT (DB) オペレーターはデータベース データのみに使用されます。Hadoop データの場合は、Disctinct (HD) オペレーターを使用します。

入力

データベースソース。ユーザーが個別の組み合わせが必要なカラムを選択すると、オペレーターが計算を実行します。

値が不正または欠落しています
欠損値は、個別の値の決定の一部として考慮されます。列に欠損値がある場合、欠損値は値とは別のものとみなされます。
このオペレーターは、入力計算から Null 値を除外することによって、Null 値を処理します。この動作を防ぐには、最初のトレーニング データに対して Null 値置換 (DB) オペレーターを使用して、不正な値または欠落している値を置き換えます。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
個別のカラム

*必須

データ行の生成に使用するデータ ソースから 1 つ以上のカラムを選択します。各行には列値の個別の組み合わせが含まれます。
出力タイプ
  • [テーブル] はデータベース テーブルを出力します。 [テーブル] を指定すると、[ストレージ パラメーター] が有効になります。
  • [ビュー] はデータベース ビューを出力します。
出力スキーマ 出力テーブルまたはビューのスキーマ。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
存在する場合は削除 既存のテーブルを上書きするかどうかを指定します。
  • はい - その名前のテーブルが存在する場合、結果を保存する前にテーブルが削除されます。
  • いいえ - その名前のテーブルが存在する場合、結果ウィンドウにエラー メッセージが表示されます。

出力

データ出力
選択されたカラムのみを含むデータのサブセット。各行はそれらのカラムの値の個別の組み合わせのみを含みます。