動的カラム フィルター
このオペレーターは、データ ソースからカラムのサブセットを選択します。選択したカラムのみが出力データセットに残ります。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
アルゴリズム
このオペレーターは、データ分析ワークフローに必要のないカラムがデータ ソース内に多数ある場合、またはカラムを動的に選択する必要がある場合に特に役立ちます。カラム名によってカラムのサブセットを選択するための正規表現を指定することもできます。
動的カラム フィルター オペレーターは、モデリング オペレーターと組み合わせて使用するように設計されています。これらのオペレーターで [使用可能なすべてのカラムを予測子として使用する] パラメーターが [はい] に設定されている場合、モデリング オペレーターの前に配置される動的カラム フィルター オペレーターによって、どのカラムが予測子としてダイナミックに使用されるかが決定されます。
入力
入力は単一の表形式のデータセットです。
構成
次の表に、動的カラム フィルター オペレーターの構成の詳細を示します。
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 含めるカラム | 分析に使用できるカラム。選択できるのは静的なカラムのみです。 [カラムの選択] をクリックしてカラムを選択します。これはオプションのパラメーターです。 |
| 含めるデータ タイプ | 含めるデータ タイプを指定します。 [選択] をクリックしてデータ タイプを選択します。これはオプションのパラメーターです。次の値が使用可能です。
デフォルトでは、すべてのデータ タイプが選択されています。 ノート: 複数のデータ タイプを選択することも、何も選択しないこともできます。デフォルトではすべてのデータ タイプが選択されているため、このデフォルトの選択を変更しなくても、テーブル全体が出力として取得されます。 |
| 含めるカラム名 (正規表現) | カラムのサブセットを名前で選択するための正規表現またはワイルドカードを指定します。これはオプションのパラメーターです。 ノート: 正規表現では、ドル記号 ( $) は使用できません。代わりに \Z を使用できます。 |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存できます。 [いいえ] に設定すると、オペレーターが結果を保存できなくなります。 |
出力
例
次の例は、動的カラム フィルター オペレーターのワークフローを示しています。
-
含めるカラム: CustomerStatus
-
含めるデータ タイプ: 文字列
-
含めるカラム名 (正規表現): ^Data
上の表では、カラム CustomerStatus は [含めるカラム] パラメーターに基づいて含まれています。 InitialChannel カラムと Handset カラムは、[含めるデータ タイプ] パラメーターに基づいて組み込まれます。最後に、カラム DataUpload と DataDownLoad は、[Data] で始まるすべての変数を要求する正規表現を満たしているため、結果に含まれます。
追加正規表現の例
次の表に、正規表現の例を示します。緑色は、指定された正規表現に基づいて含まれるカラムを強調表示しています。