ワークフロー

ワークフローと呼ばれるオペレーターの有向グラフを使用して分析プロセスをモデル化します。ワークフローは、データ ソースとオペレーター (アルゴリズムとトランスフォーメーション) を組み合わせます。

各オペレーターは、前のオペレーターまたはデータ ソースから入力を受け取り、そのタスクを実行して、後続のオペレーター用の出力を生成します。オペレーターには、ユーザーが構成できるパラメーターがあります。これらのパラメーターは、分析するカラムからジョブのパフォーマンスを微調整するための Spark 設定まで、あらゆるものに影響を与える可能性があります。アプリケーションは、オペレーター間の接続を作成し、パラメーターを構成するときに検証チェックを実行します。

実行時に、オペレーターから生成された情報は、後続のオペレーターに渡されます。これにより、オペレーターを介した情報フローが形成され、中間点で検査および分析できるようになります。

ワークフローを実行する際、TIBCO Data Science - Team Studio は、実行しているものがグラフのそのポイントに達すると、各オペレーターの入力と必要な依存関係をチェックします。必要なパラメータが欠落している場合、ワークフローは開始されず、エラーが報告されます。さらに、問題のあるオペレーターのタイトルが赤で表示されます。

オペレーターが作業を終えると、TIBCO Data Science - Team Studio は、出力を取得し、ワークフロー結果画面のセクションとして表示します。