ワークフロー変数を使用した Hadoop データ ソース パラメーターのオーバーライド

ワークフロー変数設定を使用して、デフォルトの Hadoop データ ソース パラメーターをオーバーライドすることができます。

これにより、指定されたワークフローのみの Hadoop データ ソース設定が微調整されます。

  • ワークフローの変数を表示するには、[アクション] ドロップダウン リスト ボックスから [ワークフロー変数] を選択します。
  • デフォルトの Hadoop 設定 (タスクがタイムアウトになるまでの時間など) を上書きするための新しい変数を作成するには、[作成] をクリックします。
  • デフォルトは 600,000 ミリ秒 (または 10 分) です。
  • 特定のワークフローの Hadoop 変数をオーバーライドするには、[作成] をクリックし、@alpine.mapred.mapred.task.timeout などの新しい変数を作成します。ここで、この新しい変数例については次のとおりです。

    • @alpine.mapred. は、TIBCO Data Science - Team Studio Hadoop 変数のオーバーライドであり、mapred.task.timeout は正式な Hadoop 変数名です。
    • たとえば、値を 300000 に設定します。

  • ワークフロー内の特定のオペレーター タスクに対してのみ Hadoop 変数をオーバーライドするには、@alpine.mapred.join.Hadoop_Join.mapred.task.timeout などの新しい変数を作成します。ここで、この新しい変数例については次のとおりです。

    • @alpine.mapred. は、TIBCO Data Science - Team Studio Hadoop 変数へのオーバーライドであることを示します。
    • join は、ジョイン オペレーター用であることを示します。
    • Hadoop_Join は、オーバーライドされる特定のオペレーター ジョブを示します。
    • mapred.task.timeout は、Hadoop の公式変数名です。
    • たとえば、オーバーライド値 (このワークフローのジョイン オペレーターのみ) を 200,000 に設定します。

ノート: ここでは、ワークフロー レベルまたは Hadoop データ ソース レベルで、可能な Hadoop 構成パラメーターを構成できます。Hadoop 構成パラメーターのリストは次のとおりです。

ノート: 特定のオペレーター タスクをカスタマイズするには、正しいTIBCO Data Science - Team Studio オペレーター名とジョブ名を参照する必要があります。TIBCO Data Science - Team Studio オペレーターとジョブ名リストは次のとおりです。

TIBCO Data Science - Team Studio オペレーターのジョブ名