混同行列

このオペレーターは、分類モデルの実際の数と予測された数に関する情報を表示し、考えられる各クラス値に対するモデルの精度を評価するのに役立ちます。

情報一覧

ノート: このオペレーターは、TIBCO® Data Virtualization および Apache Spark 3.2 以降でのみ使用できます。

パラメーター

説明
カテゴリー モデルの検証
データ ソース タイプ TIBCO® Data Virtualization
出力を他のオペレーターに送信 いいえ
データ処理ツール TIBCO® DV, Apache Spark 3.2 以降

アルゴリズム

混同行列オペレーターは、分類モデリング アルゴリズムの予測分類の精度を評価するために使用される分類モデルです。詳細については、混同行列を参照してください。

このオペレーターは、1 つ以上の分類モデル オブジェクトと入力データセットを上流から受け取ります。各モデル オブジェクトを入力データに適用し、混同行列を計算します。モデルのパフォーマンスは、行列内の真陽性、真陰性、偽陽性、および偽陰性の数を使用して評価されます。

入力

入力は、1つの表データセットと1つ以上の TIBCO Data Virtualization モデル オペレーターです。

不正な値または欠落している値
  • オペレーターは分類モデルのみを受け入れます。
  • オペレーターは複数のデータセットを受け入れません。
  • Null 値は許されず、エラーとなります 。
  • エラーを防ぐために、2 種類の入力 (表形式データと少なくとも 1 つのモデル オブジェクト) をこのオペレーターに接続する必要があります。
  • 従属変数は入力データセット内に存在する必要があります。そうでない場合、オペレーターはエラーを生成します。

構成

次の表に、混同行列オペレーターの構成の詳細を示します。

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
出力スキーマ 出力テーブルまたはビューのスキーマを指定します。
出力テーブル 結果の出力が生成されるテーブルのパスと名前を指定します。デフォルトでは、これはユーザー ID、ワークフロー ID、およびオペレーターに基づく一意のテーブル名です。
結果の保存 [はい] に設定すると、オペレーターは結果を保存します。 [いいえ] に設定すると、オペレーターは結果を保存しません。

出力

ビジュアル出力
各上流モデル オペレーターの出力を表示するテーブル。
データ出力
なし。これはターミナル オペレーターです。

次の例では、golf train データセットを使用して ナイーブ ベイズ モデルを構築し、そのモデルと golf test データセットを混同行列オペレーターで評価します。

混同行列オペレーターのワークフロー
データ
golf train: このデータセットには次の情報が含まれています。
  • 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
  • 複数行 (14 行)。
golf test: このデータセットには次の情報が含まれています。
  • 複数のカラム、ここでは、天気概況、気温、風、湿度、プレー。
  • 複数行 (14 行)。
パラメーター設定
特定のデータセットのパラメーター設定は次のとおりです。
  • 結果を保存: はい

結果
次の図は、指定されたデータセットのパラメーター設定の結果を示しています。
混同行列オペレーター - [出力]タブ