変数

このオペレーターは、入力データセットのデータ フィールドから作成された変数を定義し、新しいテーブルまたはビューを形成するために使用されます。

変数オペレーターのアイコン

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降
重要: 作成された変数は本質的に静的です。実行時に動的に変更することはできません。

また、変数オペレーターを使用してデータ行を分位数に分割し、データに分位数変数を追加することもできます。データをさらに小さな分割 (分位数) に分割すると、全体的なデータ分布パターンを理解できるようになります。

ノート: スクリプト モードのカラム名に特殊文字や中国語、日本語、韓国語などのマルチバイト文字が含まれている場合は、カラム名をバッククォート (` `) で囲む必要があります。二重引用符を使用してカラム名を囲まないでください。

入力

入力は単一の表形式のデータセットです。

不正な値または欠落している値
Null 値は許されず、エラーとなります 。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
変数 新しい変数カラムを作成する式を指定します。 [変数の定義] をクリックして変数を定義します。詳細については、「変数の定義 ダイアログ」を参照してください。
ノート: これは Spark SQL であるため、SQL 式は Spark でサポートされている SQL 構文に準拠している必要があります。構文の詳細については、「Spark SQL 構文と式」を参照してください。
分位変数 作成する新しい変数が分位値変数の場合は、分位値の導出に使用する必要なカラムを選択します。

可能な分位値タイプは、[平均上昇率] (ビンを自動的に作成します) と [カスタマイズ] (変数ビンを手動で定義します) です。

ノート: 自動変数ビニングは、Greenplum、Postgres、Oracle、SQL Server など、NTILE をサポートするデータベースでのみ実行できます。現在 NTILE をサポートしていない Teradata、MySQL、MariaDB などのデータベースではサポートされません。

詳細については、「分位変数の定義ダイアログ」を参照してください。

カラム 含めるカラムを指定します。詳細については、「カラムの選択ダイアログ」を参照してください。
出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
データセットの出力を表示するテーブル。派生変数に加えてすべてのデータ行を表示するには、[カラム] パラメーターですべてのカラムを選択します。
データ出力
新しく作成されたテーブルまたはビューの表形式のデータセット。

次の例では、指定されたデータセットのデータ フィールドから作成された変数を表示し、変数オペレーターを使用して新しいテーブルを形成します。

変数オペレーターのワークフロー
データ
golf: このデータセットには次の情報が含まれています。
  • 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
  • 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
  • 変数: テスト

  • カラム: 温度、湿度、風

  • 結果を保存: はい

出力
次の図は、golf データセットのパラメーター設定の出力を示しています。
変数オペレーター 出力