データベースへのコピー

Hadoop からリレーショナル データベースにデータをコピーするメカニズムを提供します。

データベースへのコピーする

情報一覧

パラメーター

説明
カテゴリー データ ロード
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール Sqoop

データベースへのコピーすると、通常、コピーされたデータを保存する新しいテーブルがデータベースに作成されます。Hadoop ファイルに関連付けられたカラムとデータ タイプの情報を使用して、テーブルの構造を決定します。ユーザーが指定した宛先テーブルがすでに存在する場合、オペレーターは次のいずれかの方法で応答するように構成できます。

  • まずテーブルを削除します。
  • 新しいデータを追加します。
  • 操作をスキップします。
  • エラーが発生します。

コピー プロセスは、パラレル モードまたはシンプル モードで実行できます。

入力

Hadoop ファイル、または保存されたファイルを生成する Hadoop オペレーター (つまり、[結果の保存] オプションが [true] に設定されている任意の Hadoop オペレーター)。

制限事項

オペレーターはシンプルモードでのみ動作します。TIBCO Data Virtualization。並列モードについては、Sqoop ドキュメントでサポートされているデータベースを参照してください。

構成

パラメーター 説明
メモ このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
コピー先 データのコピーに使用されるデータ ソース接続。
デスティネーション データのコピー先のスキーマ。
テーブル名 データが保存されているテーブルの名前。デフォルトのテーブル名で使用される変数の詳細については、「ワークフロー変数」を参照してください。

デフォルト名: alp@user_id_@flow_id_todb_0

テーブルが存在する場合 テーブル名 で指定された宛先テーブルがすでに存在する場合に使用するオプション。
  • ドロップ (デフォルト) - 最初にテーブルを削除します。
  • エクステンド - 新しいデータを追加します。
  • エラー - エラーを報告し、ワークフローの実行を停止します。
  • スキップ - 操作をスキップします。
コピー モード コピー方法。
  • パラレル(デフォルト) - 基礎となる Sqoop テクノロジーを使用して並列コピーします。
  • シンプル - バッチ処理のコピー プロセスを使用してコピーします。
コピー タスクの数 Sqoop 並列処理コピー モードに使用する並列プロセスの数。 [パラレル] コピー モードのみ。

デフォルト値: 4

高度なパラメーター [設定] をクリックして 高度なパラメーター設定ダイアログ を表示し、Sqoop によるパラレル コピーの詳細設定パラメーターを設定します。

出力

ビジュアル出力
コピーされたデータの行のプレビュー。
データ出力
宛先テーブルに対応するデータセット。[データベースへのコピー] オペレーターの出力は、データベース テーブルまたはビューを受け入れるオペレーターへの入力として使用できます。