Excel のインポート

このオペレーターは、Excel ワークブック シート (またはシートの指定された部分) を Chorus ワークスペースからデータベース テーブルとしてインポートします。オペレーターは、TIBCO® Data Virtualization を使用して、インポートされたデータベーステーブルのスキーマを推測します。

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー データ ロード
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

ワークスペースから Excel ファイルがメモリに読み込まれます。 シート番号左上隅のセル右カットオフ カラム文字下カットオフ行で指定されたデータNumber 個のパラメーターが抽出されます。 ヘッダー行あり パラメーターが [いいえ] に設定されている場合、オペレーターは抽出されたデータセットの先頭に Col プレフィックスを付けたカラム名の行を追加します。次に、データは、1,000 レコードのバッチで TIBCO Data Virtualization にアップロードされます。TIBCO Data Virtualization は、各カラムのデータ値に基づいて結果データベース テーブルのスキーマを推測します。結果のスキーマは、ダウンストリームのオペレーターに渡されます。

ノート: ダウンストリーム オペレーターを実行する前に、このオペレーターを ステップ実行 または 実行 する必要があります。

入力

インポート Excel オペレーターはソース オペレーターです。したがって、入力データ ポートはありません。

不正な値または欠落している値
空白セルまたは空のセルは Null 値に変換されます。

制限事項

Excel ファイルはTIBCO Data Science - Team Studio サーバ。インスタンスで利用可能なメモリによっては、このサーバーに非常に大きな Excel ファイルを読み込むと大量のメモリが必要となり、メモリ不足の問題が発生する可能性があります。詳細については、Apache POI の制限を参照してください。

構成

次の表に、インポート Excel オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
Excel ワークブック 現在のワークスペースに保存されている Excel ワークブックを選択します。 .xls.xlsx、および .xlsm 拡張子を持つワークブックのみを選択できます。Excel ファイルをワークスペースにアップロードする方法の詳細については、「ワーク ファイルの作成」を参照してください。
シート番号 Excel ワークブックから抽出するシートの数を指定します (最初のシートは 1)。

デフォルト: 1

左上隅のセル 選択したシート内で抽出するデータ部分の左上のセルを定義するセルアドレスを指定します(例:B10)。
右切り取りカラム文字 抽出するデータの部分を右側で切り取るカラム文字を指定します。指定しない場合、データ抽出は選択された最初の行の最後に定義されたセル (左上隅のセルの行番号) で切り取られます。このパラメーターはオプションです。
下端カットオフ行番号 (0=指定なし)

抽出するデータの部分を下部から切り取る行番号を指定します。これを 0 に設定すると、データ抽出はシート内の最後に定義された行で切り取られます。このパラメーターはオプションです。

ノート: これは Excel ワークシートに示されている行番号であり、抽出される実際の行数ではありません。

たとえば、左上隅のセルA1 で、ヘッダー行あり[はい] の場合、抽出する行は 下限行番号 - 1 です。

ヘッダー行あり 最初の行をヘッダーとして扱い、行の各セル値を結果テーブルのカラム名として使用するかどうかを指定します。これを [いいえ] に設定すると、カラム名は Col1、Col2、Col3 などに設定されます。
出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
  • 出力: 指定された Excel ワークシートから抽出されたデータを表示します。
  • パラメーター サマリー情報: 入力パラメーターとその現在の設定に関する情報が表示されます。
後続のオペレーターへの出力
Excel シートから抽出された単一の表形式のデータセット。ダウンストリーム オペレーターが使用できます。このオペレーターの実行後にカラム スキーマが生成されます。

次の例は、Excel のインポートオペレーターを示しています。

Excel オペレーターのワークフローのインポート
データ
ありません。
パラメーター設定
Import Excel オペレーターのパラメーター設定は次のとおりです。
  • Excel ワークブック: raw_materials.xlsx

    ノート: raw_materials.xlsx ファイルは現在のワークスペースで使用できます。
  • シート番号: 1

  • 左上隅のセル: A1

  • 下端カットオフ行番号: 0

  • ヘッダー行あり: はい

  • 結果を保存: はい

結果

次の図は、インポート Excel オペレーターのパラメーター設定の出力を示しています。

出力
Excel インポートオペレーター - 「結果」タブ