Excel のインポート (DB)
Excel ワークブックのシート (またはシートの一部) をデータベース テーブルとしてインポートします。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | データ ロード |
| データ ソース タイプ | DB |
| 出力を他のオペレーターに送信 | はい1 |
| データ処理ツール | なし |
Excel ワークブックは現在のワークスペースに保存できます。
数式セル、スタイル、日付、通貨、パーセントなどがサポートされており、数値として解析されます。画像やピボット テーブルなどの非表形式データはスキップされます。非表示のカラムと保護されたシートは通常どおり解析されます。
入力
インポート Excel (DB) はソース オペレーターです。入力は必要ありません。
制限事項
Excel ファイルは、TIBCO Data Science - Team Studio サーバで読み込まれます。インスタンスで利用可能なメモリによっては、このサーバーに非常に大きな Excel ファイルを読み込むと大量のメモリが必要となり、メモリ不足の問題が発生する可能性があります。詳細については、https://poi.apache.org/spreadsheet/limitations.html で Apache POI の制限を参照してください。
TIBCO Data Science - Team Studio は、alpine.conf ファイルで設定された構成パラメータ custom_operators を使用して、大きすぎるファイルのロードを回避します。Excel ファイルがこの制限より大きい場合、ファイルは読み込まれず、エラー メッセージが表示されます。デフォルト値は 30.0 (MB) です。TIBCO Data Science - Team Studio インスタンスの管理者は、デフォルト値を変更できます。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| データ ソース (DB) | 出力を保存するデータ ソース (および カラム メタデータ テーブル が保存される場所)。 |
| スキーマ | 出力を保存するスキーマ (および カラム メタデータ テーブル が保存される場所)。 |
| Chorus ワーク ファイル | 現在のワークスペースに保存されている Excel ワークブック。拡張子が .xls、.xlsx、および .xlsm のワークブックのみが表示されます。 |
| シート番号 | 抽出するシートの番号 (最初のシートは 1)。 |
| 左上コーナーのセル | 選択したシート内で抽出するデータ部分の左上のセルを定義するセル アドレス (たとえば、B10)。 ノート: ヘッダーがシートに含まれている場合は、選択範囲でスキップします。たとえば、ヘッダーが A1 で始まる場合、入力される左上隅のセルは B1 である必要があります。これは、ヘッダーが、名前とカラム タイプの両方を含む CSV ファイルから [カラム メタデータ ファイル (CSV)] パラメーターで個別に読み取られるためです。 |
| 右カットオフ カラム文字 | 抽出するデータの部分を右側のどこで切り取るかを定義するオプションのカラム文字。指定しない場合、データ抽出は選択された最初の行の最後に定義されたセル ([左上コーナーのセル] の行番号) で切り取られます。 ノート: このパラメーターが指定されておらず、選択された最初の行が空であるか定義されていない場合は、エラーが表示されます。 |
| ボトム カットオフ行番号 | 抽出するデータの部分を下部のどこで切り取るかを定義するオプションの行番号。これが指定されていない場合、データ抽出はシート内の最後に定義された行で切り取られます。 |
| カラム メタデータ テーブル | 出力のヘッダーを定義するデータベース テーブル。これはカラム名のみを含む空のテーブルである必要があります (タイプはテーブルの作成時、ユーザー インターフェイス経由でアップロードするとき、または手動で定義されます)。 このテーブルは実行時に読み取られ、後続のオペレーターはオペレーターの実行後にのみ出力スキーマを使用できます。 |
| 存在する場合は削除 | 同じ名前のテーブルがすでに存在する場合の動作を指定します。
|
出力

