変数
このオペレーターは、入力データセットのデータ フィールドから作成された変数を定義し、新しいテーブルまたはビューを形成するために使用されます。
情報一覧
ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
重要: 作成された変数は本質的に静的です。実行時に動的に変更することはできません。
また、変数オペレーターを使用してデータ行を分位数に分割し、データに分位数変数を追加することもできます。データをさらに小さな分割 (分位数) に分割すると、全体的なデータ分布パターンを理解できるようになります。
ノート: スクリプト モードのカラム名に特殊文字や中国語、日本語、韓国語などのマルチバイト文字が含まれている場合は、カラム名をバッククォート (` `) で囲む必要があります。二重引用符を使用してカラム名を囲まないでください。
入力
入力は単一の表形式のデータセットです。
不正な値または欠落している値
Null 値は許されず、エラーとなります 。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 変数 | 新しい変数カラムを作成する式を指定します。 [変数の定義] をクリックして変数を定義します。詳細については、「変数の定義 ダイアログ」を参照してください。 ノート: これは Spark SQL であるため、SQL 式は Spark でサポートされている SQL 構文に準拠している必要があります。構文の詳細については、「Spark SQL 構文と式」を参照してください。 |
| 分位変数 | 作成する新しい変数が分位値変数の場合は、分位値の導出に使用する必要なカラムを選択します。 可能な分位値タイプは、[平均上昇率] (ビンを自動的に作成します) と [カスタマイズ] (変数ビンを手動で定義します) です。 ノート: 自動変数ビニングは、Greenplum、Postgres、Oracle、SQL Server など、NTILE をサポートするデータベースでのみ実行できます。現在 NTILE をサポートしていない Teradata、MySQL、MariaDB などのデータベースではサポートされません。 詳細については、「分位変数の定義ダイアログ」を参照してください。 |
| カラム | 含めるカラムを指定します。詳細については、「カラムの選択ダイアログ」を参照してください。 |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
出力
ビジュアル出力
データセットの出力を表示するテーブル。派生変数に加えてすべてのデータ行を表示するには、[カラム] パラメーターですべてのカラムを選択します。
データ出力
新しく作成されたテーブルまたはビューの表形式のデータセット。
例
次の例では、指定されたデータセットのデータ フィールドから作成された変数を表示し、変数オペレーターを使用して新しいテーブルを形成します。
データ
golf: このデータセットには次の情報が含まれています。
- 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
- 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
-
変数: テスト
-
カラム: 温度、湿度、風
-
結果を保存: はい
出力
次の図は、golf データセットのパラメーター設定の出力を示しています。