カラムの並べ替え (HD)

入力テーブルの 1 つ以上のカラムの順序を変更し、必要に応じてそれらの名前を変更します。

情報一覧

パラメーター

説明
カテゴリー トランスフォーム
データ ソース タイプ HD
出力を他のオペレーターに送信 はい
データ処理ツール Spark

ノート: カラムの並べ替え (HD) オペレーターは、Hadoop データのみを対象としています。データベース データの場合は、カラムの並べ替え (DB) オペレーターを使用します。

入力

表形式のデータセット。

構成

ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
順序付けされたカラム [定義] をクリックして、出力の最初のカラムとなるカラムを (順番に) 指定し、必要に応じてそれぞれに新しい名前を指定します。詳細については、「順序付きカラム ダイアログ」を参照してください。
保持するカラム 出力に保持する他のカラムを指定します。
ストレージ フォーマット 結果を保存する形式を選択します。保存形式はオペレーターの種類によって決まります。

一般的な形式は、AvroCSVTSV、または Parquet です。

圧縮 出力の圧縮のタイプを選択します。

利用可能な Parquet 圧縮オプション。

  • GZIP
  • Deflate
  • Snappy
  • 圧縮なし

利用可能な Avro 圧縮オプション。

  • Deflate
  • Snappy
  • 圧縮なし
出力ディレクトリ 出力ファイルを保存する場所。
出力名 結果を含める名前。
出力を上書き そのパスにある既存のデータを削除するかどうかを指定します。
  • はい - パスが存在する場合は、そのファイルを削除し、結果を保存します。
  • いいえ - パスがすでに存在する場合は失敗します。
高度な Spark 設定の自動最適化
  • [はい] は、デフォルトの Spark 最適化設定の使用を指定します。
  • [いいえ] を選択すると、カスタマイズされた Spark 最適化を提供できます。 [設定の編集] をクリックして、Spark の最適化をカスタマイズします。詳細については、「詳細設定ダイアログ」を参照してください。

出力

ビジュアル出力
出力 (出力データセットのプレビュー):

サマリー:

データ出力
カラムの順序が変更され、(オプションで) 名前が変更されたカラムを含む表形式のデータセット。