R 実行 (HD)
R 実行を構成するには、有効なデータ ソースを R 実行オペレーターに接続します。中間オペレーターも R 実行のデータ ソースを構成します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | ツール |
| データ ソース タイプ | HD |
| 出力を他のオペレーターに送信 | いいえ |
| データ処理ツール | R エンジン |
R 実行 (HD) は Hadoop データのみに使用されます。データベース データの場合は、R 実行 (DB) オペレーターを使用します。
このオペレーターの設定と使用の詳細については、「R 実行」を参照してください。
入力
スクリプト内で alpine_input という R オブジェクトを参照することで、入力データセットが必要であることを指定します。これはデータ フレーム オブジェクトです。
入力データセットを使用しないことを選択することもできます (スクリプトで alpine_input を参照しないことにより)。その場合、データは R に読み込まれません。
- 入力が先行するオペレーターの場合、先行するオペレーターが実行されますが、スクリプトで alpine_input を使用しないとデータは R に転送されません。
- 前述のオペレーターがデータ ソース (Hadoop ファイルまたはデータベース テーブル) である場合、Hadoop データ転送またはデータベース クエリは実行されないため、実行時間が節約されます。
制限事項
パッケージ、システム、サーバーの要件については、TIBCO® Data Science - Team Studio システム要件 の「R 実行前提条件」を参照してください。構成
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| R スクリプト | 実行する R スクリプト。 [句の定義] を選択して R スクリプトを指定します。 |
| 結果ロケーション | R 実行オペレーターの結果が保存される HDFS ディレクトリを指定します。これはメイン ディレクトリであり、そのサブディレクトリは [結果名] オプションで指定されます (下記を参照)。 [ファイルを選択] をクリックして場所を指定します。テキストを直接編集しないでください。 |
| 結果名 | R 実行オペレーターの結果が保存される Hadoop ファイルの名前を選択します。 |
| 上書き | 同じ名前のファイルが存在する場合、オペレーターが既存のファイルを上書きするかどうかを決定します。 デフォルト値: はい |
| パス出力ファイル | R 実行 出力を次のオペレーターに渡すかどうかを指定します。
デフォルト値: いいえ |
| 結果ファイルの構造 | 次のオペレーターに渡すオペレーターの出力のファイル構造を指定します ([パス出力ファイル] が [はい] に設定されている場合)。 詳細については、「結果ファイル構造 ダイアログ」を参照してください。 |
出力
alpine_output オブジェクトが R コードに存在しない場合、出力は生成されません。 [パス出力ファイル] を [はい] に設定し、R スクリプトに alpine_output オブジェクトへの参照が含まれていない場合、フローは次の時点で失敗します。実行時に、この不一致に対してエラー メッセージが表示されます。

R コードで alpine_output オブジェクトを作成した場合、R 実行オペレーター出力は、Data タブの結果コンソールに出力データフレーム(HDFS/MapR ファイル構造に永続化)を表示します。

R コードに出力を R コンソールに出力する関数が含まれている場合、出力は結果コンソールの R コンソール出力 タブに表示されます。
summary(alpine_input) という文があると、R コンソールや RStudio コンソールに表示されます。しかし、R 実行はコンソール出力をオブジェクトに取り込んでいるので(R の capture.output 関数を使って R で実行されます)、このような呼び出しは print() 関数を使ってラップする必要があります。例えば、summary(alpine_input) の代わりに、print(summary(alpine_input)) と指定します。これは R の capture.output 関数の動作の制限です。
R コードは、結果コンソールの R-Script タブに表示されます。