Excel のインポート
このオペレーターは、Excel ワークブック シート (またはシートの指定された部分) を Chorus ワークスペースからデータベース テーブルとしてインポートします。オペレーターは、TIBCO® Data Virtualization を使用して、インポートされたデータベーステーブルのスキーマを推測します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | データ ロード |
| データ ソース タイプ | TIBCO® Data Virtualization |
| 出力を他のオペレーターに送信 | はい |
| データ処理ツール | TIBCO® DV, Apache Spark 3.2 以降 |
ワークスペースから Excel ファイルがメモリに読み込まれます。 シート番号、左上隅のセル、右カットオフ カラム文字、下カットオフ行で指定されたデータNumber 個のパラメーターが抽出されます。 ヘッダー行あり パラメーターが [いいえ] に設定されている場合、オペレーターは抽出されたデータセットの先頭に Col プレフィックスを付けたカラム名の行を追加します。次に、データは、1,000 レコードのバッチで TIBCO Data Virtualization にアップロードされます。TIBCO Data Virtualization は、各カラムのデータ値に基づいて結果データベース テーブルのスキーマを推測します。結果のスキーマは、ダウンストリームのオペレーターに渡されます。
入力
インポート Excel オペレーターはソース オペレーターです。したがって、入力データ ポートはありません。
制限事項
Excel ファイルはTIBCO Data Science - Team Studio サーバ。インスタンスで利用可能なメモリによっては、このサーバーに非常に大きな Excel ファイルを読み込むと大量のメモリが必要となり、メモリ不足の問題が発生する可能性があります。詳細については、Apache POI の制限を参照してください。
構成
次の表に、インポート Excel オペレーターの構成の詳細を示します。
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| Excel ワークブック | 現在のワークスペースに保存されている Excel ワークブックを選択します。 .xls、.xlsx、および .xlsm 拡張子を持つワークブックのみを選択できます。Excel ファイルをワークスペースにアップロードする方法の詳細については、「ワーク ファイルの作成」を参照してください。 |
| シート番号 | Excel ワークブックから抽出するシートの数を指定します (最初のシートは 1)。 デフォルト: 1 |
| 左上隅のセル | 選択したシート内で抽出するデータ部分の左上のセルを定義するセルアドレスを指定します(例:B10)。 |
| 右切り取りカラム文字 | 抽出するデータの部分を右側で切り取るカラム文字を指定します。指定しない場合、データ抽出は選択された最初の行の最後に定義されたセル (左上隅のセルの行番号) で切り取られます。このパラメーターはオプションです。 |
| 下端カットオフ行番号 (0=指定なし) |
抽出するデータの部分を下部から切り取る行番号を指定します。これを 0 に設定すると、データ抽出はシート内の最後に定義された行で切り取られます。このパラメーターはオプションです。 ノート: これは Excel ワークシートに示されている行番号であり、抽出される実際の行数ではありません。
たとえば、左上隅のセル が A1 で、ヘッダー行あり が [はい] の場合、抽出する行は 下限行番号 - 1 です。 |
| ヘッダー行あり | 最初の行をヘッダーとして扱い、行の各セル値を結果テーブルのカラム名として使用するかどうかを指定します。これを [いいえ] に設定すると、カラム名は Col1、Col2、Col3 などに設定されます。 |
| 出力スキーマ | 出力テーブルまたはビューのスキーマを指定します。 |
| 出力テーブル | 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。 |
| 結果の保存 | [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。 |
出力
- 出力: 指定された Excel ワークシートから抽出されたデータを表示します。
- パラメーター サマリー情報: 入力パラメーターとその現在の設定に関する情報が表示されます。
例
次の例は、Excel のインポートオペレーターを示しています。
-
Excel ワークブック: raw_materials.xlsx
ノート: raw_materials.xlsx ファイルは現在のワークスペースで使用できます。 -
シート番号: 1
-
左上隅のセル: A1
-
下端カットオフ行番号: 0
-
ヘッダー行あり: はい
-
結果を保存: はい
次の図は、インポート Excel オペレーターのパラメーター設定の出力を示しています。