カラムの並べ替え (HD)
入力テーブルの 1 つ以上のカラムの順序を変更し、必要に応じてそれらの名前を変更します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | トランスフォーム |
| データ ソース タイプ | HD |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | Spark |
ノート: カラムの並べ替え (HD) オペレーターは、Hadoop データのみを対象としています。データベース データの場合は、カラムの並べ替え (DB) オペレーターを使用します。
入力
表形式のデータセット。
構成
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 順序付けされたカラム | [定義] をクリックして、出力の最初のカラムとなるカラムを (順番に) 指定し、必要に応じてそれぞれに新しい名前を指定します。詳細については、「順序付きカラム ダイアログ」を参照してください。 |
| 保持するカラム | 出力に保持する他のカラムを指定します。 |
| ストレージ フォーマット | 結果を保存する形式を選択します。保存形式はオペレーターの種類によって決まります。 一般的な形式は、Avro、CSV、TSV、または Parquet です。 |
| 圧縮 | 出力の圧縮のタイプを選択します。 利用可能な Parquet 圧縮オプション。
利用可能な Avro 圧縮オプション。
|
| 出力ディレクトリ | 出力ファイルを保存する場所。 |
| 出力名 | 結果を含める名前。 |
| 出力を上書き | そのパスにある既存のデータを削除するかどうかを指定します。
|
| 高度な Spark 設定の自動最適化 |
|
出力
ビジュアル出力
出力 (出力データセットのプレビュー):

サマリー:

データ出力
カラムの順序が変更され、(オプションで) 名前が変更されたカラムを含む表形式のデータセット。