R 実行 (HD)

R 実行を構成するには、有効なデータ ソースを R 実行オペレーターに接続します。中間オペレーターも R 実行のデータ ソースを構成します。

情報一覧

パラメーター

説明
カテゴリー ツール
データ ソース タイプ HD
出力を他のオペレーターに送信 いいえ
データ処理ツール R エンジン

R 実行 (HD) は Hadoop データのみに使用されます。データベース データの場合は、R 実行 (DB) オペレーターを使用します。

このオペレーターの設定と使用の詳細については、「R 実行」を参照してください。

入力

スクリプト内で alpine_input という R オブジェクトを参照することで、入力データセットが必要であることを指定します。これはデータ フレーム オブジェクトです。

入力データセットを使用しないことを選択することもできます (スクリプトで alpine_input を参照しないことにより)。その場合、データは R に読み込まれません。

  • 入力が先行するオペレーターの場合、先行するオペレーターが実行されますが、スクリプトで alpine_input を使用しないとデータは R に転送されません。
  • 前述のオペレーターがデータ ソース (Hadoop ファイルまたはデータベース テーブル) である場合、Hadoop データ転送またはデータベース クエリは実行されないため、実行時間が節約されます。
ノート: R コードで入力データセットを使用しない場合でも、何らかの種類のデータ ソースを指定する必要があります。これは、引き続き出力データ フレームを生成する可能性があり、そのデータ フレームが入力用に選択されたデータ ストア タイプと同じデータ ストア タイプに格納される必要があるためです (つまり、Hadoop 入力には Hadoop 出力、データベース入力にはデータベース出力)。また、同じ特定のデータ ストア (同じ Hadoop クラスターまたは同じデータベース) である必要があります。

制限事項

パッケージ、システム、サーバーの要件については、TIBCO® Data Science - Team Studio システム要件 の「R 実行前提条件」を参照してください。

構成

ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
R スクリプト 実行する R スクリプト。 [句の定義] を選択して R スクリプトを指定します。
結果ロケーション R 実行オペレーターの結果が保存される HDFS ディレクトリを指定します。これはメイン ディレクトリであり、そのサブディレクトリは [結果名] オプションで指定されます (下記を参照)。

[ファイルを選択] をクリックして場所を指定します。テキストを直接編集しないでください。

結果名 R 実行オペレーターの結果が保存される Hadoop ファイルの名前を選択します。
上書き 同じ名前のファイルが存在する場合、オペレーターが既存のファイルを上書きするかどうかを決定します。

デフォルト値: はい

パス出力ファイル R 実行 出力を次のオペレーターに渡すかどうかを指定します。

  • [はい] に設定した場合、結果ファイル構造の詳細を設定する必要があります。
  • R 実行がターミナル オペレーターの場合、[パス出力ファイル][はい] に設定する必要がないため、[パス出力ファイル][いいえ] に設定した場合、[結果ファイルの構造] を指定する必要はありません。

デフォルト値: いいえ

結果ファイルの構造 次のオペレーターに渡すオペレーターの出力のファイル構造を指定します ([パス出力ファイル][はい] に設定されている場合)。

詳細については、「結果ファイル構造 ダイアログ」を参照してください。

出力

ビジュアル出力
このテーブルは、[パス出力ファイル][はい] に設定されているかどうか、および [結果ファイルの構造] が提供されているかどうかに応じて保存されます。パス出力ファイル結果ファイル構造 の組み合わせは、R 実行オペレーターの後に別のオペレーターが続く場合にフローの整合性をチェックするためにのみ使用されます。

alpine_output オブジェクトが R コードに存在しない場合、出力は生成されません。 [パス出力ファイル][はい] に設定し、R スクリプトに alpine_output オブジェクトへの参照が含まれていない場合、フローは次の時点で失敗します。実行時に、この不一致に対してエラー メッセージが表示されます。

データ出力

R コードで alpine_output オブジェクトを作成した場合、R 実行オペレーター出力は、Data タブの結果コンソールに出力データフレーム(HDFS/MapR ファイル構造に永続化)を表示します。

R コンソール出力

R コードに出力を R コンソールに出力する関数が含まれている場合、出力は結果コンソールの R コンソール出力 タブに表示されます。

ノート: R 実行オペレーターのコンソール表示の動作は、R コンソールや RStudio の動作とは少し異なります。通常、R コードの中に summary(alpine_input) という文があると、R コンソールや RStudio コンソールに表示されます。しかし、R 実行はコンソール出力をオブジェクトに取り込んでいるので(R の capture.output 関数を使って R で実行されます)、このような呼び出しは print() 関数を使ってラップする必要があります。例えば、summary(alpine_input) の代わりに、print(summary(alpine_input)) と指定します。これは R の capture.output 関数の動作の制限です。

R スクリプト

R コードは、結果コンソールの R-Script タブに表示されます。