データ エクスプローラー
データ エクスプローラーには、選択したワークフローに接続したデータ ソースが表示されます。これらが Hadoop データ ソースであるかデータベースであるかを知る必要はありません。これらはすべてこのダイアログから参照できます。
複数のデータ ソースをワークフローに追加した場合は、最初にそれらのリストが表示されます。データ ソースを選択した後、ファイル システム/テーブルに移動し、ワークフローで使用するデータを選択できます。データをワークフローに追加するには、データをワークフロー キャンバスにドラッグします。
特定のファイルに移動するには、検索ボックスに検索語またはファイル パスを入力します。
| アイコン | 説明 |
|---|---|
|
円形の矢印はデータ ソースのリストを更新します。 |
|
プラス記号の付いたフォルダー アイコンは、ファイル階層内の現在の場所にフォルダーを追加します。 |
|
プラス記号の付いた四角形は、ローカル ファイル システムからデータセットをインポートします。 |
ファイルを選択すると、他のいくつかのオプションが使用可能になることに注意してください。
「 i 」アイコンは、そのファイルに関する情報を示します。
HDFS 上のデータセットの場合、情報は次のようになります。
データベース データセットの場合、表示される情報には、各カラムのデータ タイプと名前が表示されます。
ダウンロード矢印アイコンは、選択したファイルをローカル ファイル システムにダウンロードします。
HDFS 上のデータセットの場合、ファイルのどの部分またはファイル全体をダウンロードするかを定義できます。
データベース上のデータセットの場合、ダウンロードする行数を定義します。数値を指定しない場合は、テーブル全体がダウンロードされます。
「 x 」アイコンは、選択したデータセットを削除します。このオプションは、HDFS データ ソースでのみ使用できます。