Pig の実行

ユーザー定義の Pig スクリプトを実行します (Hadoop データ ソースの解析とソート用)。Pig 実行オペレーターは、TIBCO Data Science - Team Studio サーバに提供される Pig UDF (ユーザー定義関数) を参照することもできます。

情報一覧

パラメーター

説明
カテゴリー ツール
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール Pig

このオペレーター内で実行される Pig スクリプトには、その前のオペレーターからの結果が渡され、その結果が後続のオペレーターに渡されることが期待されます。

バージョン 5.7 以降では、出力の結果のファイル構造が自動的に検出されます。それ以外の場合は、ユーザーが出力構造を定義する必要があります。

入力

Pig 実行オペレーターは 1 つ以上の入力を受け入れることができます。ただし、入力は必須ではありません。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
Pig スクリプト 実行する Pig スクリプト。

[Pig スクリプトの編集] をクリックして、Pig スクリプト エディタ ダイアログを開きます。詳細については、「Pig スクリプトの定義ダイアログ」を参照してください。

パス出力ファイル 出力を次のオペレーターに渡すかどうかを指定します。
結果ロケーション オペレーターの結果が保存される HDFS ディレクトリ。これはメイン ディレクトリであり、そのサブディレクトリは 結果名で指定されます。 [ファイルの選択] をクリックして Hadoop ファイル エクスプローラー ダイアログ を開き、ストレージの場所を参照します。テキストを直接編集しないでください。
結果名 結果を保存するファイルの名前。
上書き そのパスとファイル名の既存のデータを削除するかどうかを指定します。
  • はい - パスが存在する場合は、そのファイルを削除し、結果を保存します。
  • いいえ - パスがすでに存在する場合は失敗します。

出力

ビジュアル出力
Pig スクリプトの出力のプレビュー。
データ出力
オペレーターで作成されたデータ。