適合度

このオペレーターは、依存カラム内の各クラスの適合度メトリックを計算します。

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー モデルの検証
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 はい
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

アルゴリズム

このオペレーターは、上流から 1 つ以上の分類モデル オブジェクトと 1 つの入力データセットを取得します。次に、各モデル オブジェクトを入力データに適用し、精度、誤差、再現率、適合率、FMeasure などの各クラスの適合度メトリックを計算します。このオペレーターは分類モデルにのみ適用されます。

入力

入力は単一の表形式のデータセットであり、TIBCO Data Virtualization モデル オペレーター。

不正な値または欠落している値
  • Null 値は許されず、エラーとなります 。
  • 表形式のデータセットと少なくとも 1 つのモデル オブジェクトをこのオペレーターに接続する必要があります。それ以外の場合、オペレーターはエラーを返します。
  • オペレーターは複数のデータセットを受け入れません。
  • 依存カラムは入力データセットで使用できる必要があります。それ以外の場合、オペレーターはエラーを返します。
  • オペレーターは分類モデルのみを受け入れます。

構成

次の表に、適合度オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
データセットの出力を表示するテーブル。
後続のオペレーターへの出力
ダウンストリーム オペレーターが使用できるデータベース テーブル出力。

次の例では、ナイーブ ベイズ モデルを構築し、適合度オペレーターを使用してモデルを評価します。

適合度オペレーターのワークフロー
データ
golf: このデータセットには次の情報が含まれています。
  • 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
  • 複数行 (14 行)。
パラメーター設定
golf データセットのパラメーター設定は次のとおりです。
  • 結果を保存: はい

出力
次の図は、golf データセットのパラメーター設定の出力を示しています。
適合度オペレーターの出力