サンプリング オペレーター

サンプリング (サンプル) オペレーターは、ソース データセットのサンプルを取得する方法を提供します。

モデルは通常、トレーニングデータセットを使用して作成され、次に検証データセットに対してテストされます。TIBCO Data Science - Team Studio では、ソースデータをサンプリングすることでこれを実現します。

TIBCO Data Science - Team Studio には、次の主要なサンプリングオペレーターが用意されています。

  • ランダム サンプリング オペレーター
  • 階層化サンプリング オペレーター

3 番目のサンプリング オペレーターであるサンプル セレクターは、以下に示すように、ランダム サンプリング オペレーターまたは層化サンプリング オペレーターの後に続き、生成されたサンプル データセットの 1 つをワークフロー内の後続のオペレーターに渡します。