適合度
トレーニングされたモデルを検証します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | モデルの検証 |
| データ ソース タイプ | DB、HD |
| 出力を他のオペレーターに送信 | いいえ |
| データ処理ツール | MapReduce |
このオペレーターは、トレーニング済みモデルを入力データセットに適用し、そのモデルに対して次の計算を行います。
- 適合率
- 再現率
- F1
- 感度
- 特異性
- 精度
これは一般に分類モデルに適用されます。
アルゴリズム
比較される両方のカラムがカテゴリー(またはレベル) である場合、自然な要約は分割表、つまりカテゴリまたはレベルの各組み合わせがどのくらいの頻度で表示されるかをカウントする単純な行列になります。たとえば、結果は次の図のようになります。
次の表に示すように、この表から、従来のすべての適合度統計 (適合率、再現率、F1、感度、特異性、精度) をすぐに読み取ることができます。
| スコア | 式 |
|---|---|
| 適合率 | TP/(TP + FP) |
| 再現率 | TP/(TP + FN) |
| F1 | 2 (適合率 x 再現率)/(適合率 + 再現率) |
| 感度 | TP/(TP + FN) |
| 特異性 | TN/(FP + TN) |
| 精度 | (TP + TN)/(TP + FP + TN + FN) |
入力
- 前のオペレーターからのデータセット。
- 前のオペレーターからのモデル。先行するオペレーターから複数のモデルを受け取った場合、その結果をモデルの比較に使用できます。この入力はデータベース データ ソースではオプションです。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 依存カラム | モデル内の従属変数として使用するカラム。 |
| モデルを使用 | (Hadoop には存在しません) 評価で、前のオペレーターからのモデルを使用するか、入力データセットの予測カラムのデータを使用するかを指定します。 true (デフォルト) の場合、少なくとも 1 つのモデル オペレーターをその直前に置く必要があります。 false の場合、予測カラムはその前のオペレーターからの入力データセットに存在する必要があります。 |
| 予測カラム | (Hadoop には存在しません) 依存カラムと比較する入力データセット内のカラムのリストを選択します。 |
出力
ビジュアル出力
各モデルの主要な適合度統計を示す適合度結果テーブル。
データ出力
なし。これはターミナル オペレーターです。