Hadoop ファイル

Hadoop データ ソースに保存されている 1 つまたは複数のファイルを指定し、データをワークフローに組み込めるようにします。

Hadoop

情報一覧

パラメーター

説明
カテゴリー データ ロード
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール MapReduce

Hadoop データは、その後、データ マイニング アルゴリズム、予測アルゴリズム、統計分析に使用できます。

TIBCO Data Science - Team Studio は、gzip または deflate コーデックを使用して圧縮形式で保存されたファイルを自動的に処理します。

入力

なし。Hadoop ファイルはソース オペレーターです。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
データ ソース名 ファイルが存在する Hadoop ファイル システムにアクセスするための Hadoop 接続。
Hadoop ファイル名 ファイルのパスと名前。 [ファイルの選択] をクリックして Hadoop ファイル エクスプローラー ダイアログを表示し、Hadoop ファイル構造を参照してファイルの場所を選択します。
ノート: ワイルドカード文字を使用して複数のファイルを処理するには、HDFS ファイルのグループの選択を参照してください。
Hadoop ファイル形式 ソース ファイルの形式。ファイル名拡張子が使用可能な場合、ファイル形式は自動的にその拡張子に基づいたデフォルトの設定になります。手動で上書きできます。

以下のファイル形式が利用可能です。

  • Avro
  • Parquet
  • テキスト ファイル

Hadoop ファイル構造 [Hadoop ファイル構造] をクリックして、カラムの構成 ダイアログを表示します。ファイルの種類によって、ダイアログの表示と構成オプションが決まります。次のファイル形式がサポートされています。

Hadoop ファイル構造設定では、Hadoop ファイル内の区切り文字、カラム、およびデータ タイプを指定します。

詳細については、「カラムの構成ダイアログ」を参照してください。

出力

ビジュアル出力
データ出力のプレビュー。
データ出力
Hadoop ファイル。