データ サイエンティスト向けの Spark 最適化
TIBCO Data Science - Team Studio の多くのオペレーターは、カスタム Spark アルゴリズムを使用して実行します。多くの Spark 実装にはデフォルトの構成設定が付属していますが、これらはすべてのユース ケースに最適であるとは限りません。
TIBCO Data Science - Team Studio からSpark 設定を編集するには次の3つの方法があります。
- オペレーター設定
- Alpine.conf (ワークフロー変数を使用してワークフロー レベルで上書き可能)
- データ ソース構成
これらの各オプションのメモリやエグゼキューターなどの設定を編集できます。それぞれはアプリケーションの異なる範囲で有効になります。
Spark 設定の詳細については、公式ドキュメントを参照してください。
サブ・トピック