Pig の実行
ユーザー定義の Pig スクリプトを実行します (Hadoop データ ソースの解析とソート用)。Pig 実行オペレーターは、TIBCO Data Science - Team Studio サーバに提供される Pig UDF (ユーザー定義関数) を参照することもできます。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | ツール |
| データ ソース タイプ | HD |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | Pig |
このオペレーター内で実行される Pig スクリプトには、その前のオペレーターからの結果が渡され、その結果が後続のオペレーターに渡されることが期待されます。
バージョン 5.7 以降では、出力の結果のファイル構造が自動的に検出されます。それ以外の場合は、ユーザーが出力構造を定義する必要があります。
入力
Pig 実行オペレーターは 1 つ以上の入力を受け入れることができます。ただし、入力は必須ではありません。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| Pig スクリプト | 実行する Pig スクリプト。 [Pig スクリプトの編集] をクリックして、Pig スクリプト エディタ ダイアログを開きます。詳細については、「Pig スクリプトの定義ダイアログ」を参照してください。 |
| パス出力ファイル | 出力を次のオペレーターに渡すかどうかを指定します。 |
| 結果ロケーション | オペレーターの結果が保存される HDFS ディレクトリ。これはメイン ディレクトリであり、そのサブディレクトリは 結果名で指定されます。 [ファイルの選択] をクリックして Hadoop ファイル エクスプローラー ダイアログ を開き、ストレージの場所を参照します。テキストを直接編集しないでください。 |
| 結果名 | 結果を保存するファイルの名前。 |
| 上書き | そのパスとファイル名の既存のデータを削除するかどうかを指定します。
|
出力
ビジュアル出力
Pig スクリプトの出力のプレビュー。
データ出力
オペレーターで作成されたデータ。