Python 実行 (DB)

現在のワークスペースに保存されている Jupyter Notebooks をワークフローから実行します。TIBCO Data Science - Team Studio

情報一覧

パラメーター

説明
カテゴリー ツール
データ ソース タイプ DB
出力を他のオペレーターに送信 はい
データ処理ツール Python

ノート: Python 実行 (DB) オペレーターはデータベース データのみを対象とします。Hadoop データの場合は、Python 実行 (HD) オペレーターを使用します。

ノートブックのセットアップ: ノートブックを Python 実行オペレーターで使用するには、自動生成されたタグ Ready For Python Execute がワークスペースに表示されている必要があります。この属性は、次の条件が満たされる場合に設定されます。

  • 引数 use_input_substitution = True または use_output_substitution = True を使用して、ノートブックに少なくとも 1 つの入力または出力が指定されています。
  • ノートブックの入力引数 execution_label は個別であり、次の文字カラムのいずれかのみになります: 12、または 3
  • たとえば、Notebooks のコードは次のようになります。

    df_account=cc.read_input_table(table_name='account'、schema_name='demo'、database_name='miner_demo'、use_input_substitution=True、execution_label="1")

  • use_input_substitution = True で定義された入力/出力はすべて DB 入力である必要があります (この場合、ノートブックは Python 実行 (DB) オペレーターで使用できます)。

入力

ノートブック構成で許可されている置換用の入力数に応じて、選択したノートブックの代替入力として使用する 0 から 3 つの入力。

最大 3 つの入力を置換できます。置換を指定したくない場合は、ノートブックで定義された入力を使用します。Python 実行を実行するには、置換された各入力に、互換性のあるデータ タイプを持つ対応するノートブック入力内のカラムのスーパーセットが含まれている必要があります。 1 つのデータセットを出力することも、ワークフロー内のターミナル オペレーターの場合は 0 個のデータセットを出力することもできます。

ノートブックの入力と出力の構成に応じて、オペレーターはソース オペレーター (ノートブックで置換用の入力が選択されていない場合) またはターミナル オペレーター (ノートブックで出力が指定されていない場合) になります。単一の出力が指定されている場合、オペレーターはこの出力を後続のオペレーターに送信します。

値が不正または欠落しています
欠損値が入力に存在する場合は削除されません。これらはノートブック内で直接処理するか、ワークフローの前のステップで処理する必要があります。

制限事項

選択したノートブックに引数 use_output_substitution = True で定義された表形式の出力がない場合、Python 実行オペレーターは後続のオペレーターにデータを送信せず、ターミナル オペレーターとみなされます。次のオペレーターは実行できませんが、ユーザーは引き続き後続のオペレーターとの接続を描画できます。

Python 実行 (DB) オペレーターは、単一のデータベース データ ソースに接続されたフローでのみ使用できます。

選択したノートブックが日時形式の変数を含む出力を送信するように設定されている場合、Python 実行オペレーターはそれらを文字列変数として次のオペレーターに送信します (その後、ユーザーはそれらを 変数オペレーターで正しい形式に変換できます)。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
ノート 現在のワークスペースで実行する Python ノートブックを選択します。このリストに表示するには、ノートブックが Python 実行で使用できるように設定されている必要があります。
ノート: [選択したノートブックを開く] をクリックすると、新しいブラウザ タブでノートブックが開きます。
入力 1 の置換 オプション。引数 execution_label = 1 を使用して、ノートブック入力の代わりに使用する接続された入力を選択します。

ノートブックにそのような入力が含まれており、ワークフローで代替を選択しない場合、ノートブックで定義された入力を使用して実行されます。

代替入力 2 オプション。引数 execution_label = 2 を使用して、ノートブック入力の代わりに使用する接続された入力を選択します。

ノートブックにそのような入力が含まれており、ワークフローで代替を選択しない場合、ノートブックで定義された入力を使用して実行されます。

入力 3 の置換 オプション。引数 execution_label = 3 を使用して、ノートブック入力の代わりに使用する接続された入力を選択します。

ノートブックにそのような入力が含まれており、ワークフローで代替を選択しない場合、ノートブックで定義された入力を使用して実行されます。

データ ソース (DB) ノートブックの実行からの出力を保存するデータ ソースを選択します (定義されている場合)。

入力が Python 実行オペレーターに接続されている場合、データ ソース (DB) は入力のデータ ソースと一致する必要があります。

出力スキーマ 出力テーブルまたはビューのスキーマ。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
存在する場合は削除 既存のテーブルを上書きするかどうかを指定します。
  • はい - その名前のテーブルが存在する場合、結果を保存する前にテーブルが削除されます。
  • いいえ - その名前のテーブルが存在する場合、結果ウィンドウにエラー メッセージが表示されます。

出力

ビジュアル出力
オペレーター結果パネルには、端末かどうかに応じて 1 つまたは 2 つのタブが表示されます。
  • 出力 (オペレーターが端末でない場合のみ利用可能):

  • 選択したパラメーターとノートブックの実行結果のサマリー:

データ出力
ノートブックに引数 use_output_substitution = True を持つ出力が含まれている場合、オペレーターは表形式のデータセットを後続のオペレーターに送信します。ノートブックで出力が定義されていない場合、このオペレーターは端末になります。