ROC
受信者動作特性 (ROC)、または ROC 曲線を生成します。
情報一覧
|
パラメーター |
説明 |
|---|---|
| カテゴリー | モデルの検証 |
| データ ソース タイプ | HD、DB |
| 出力を他のオペレーターに送信 | いいえ |
| データ処理ツール | MapReduce |
ROC 曲線は、前のオペレーターから渡されたデータセットにアルゴリズムを適用することにより、前のモデル オペレーターから渡されたトレーニング済みモデルを検証および比較するために使用されます。ROC-AUC 法では、偽陽性率 (FP) と真陽性率 (TP) の座標ペアが考慮されます。この座標セットは、受信者動作特性 (ROC) 曲線を形成します。
ROC 曲線の値は、ROC 曲線下面積 (AUC) を計算することで要約できます。
通常、ランダム モデルには対角線に沿って延びる ROC 曲線があります。より優れたモデルは左上にカーブするため、AUC 値は 1 に近づきます。
このオペレーターは、一般に、任意の分類モデル (CART、デシジョン ツリー、ロジスティック回帰、ナイーブ ベイズ、ニューラル ネットワーク、アルパイン フォレスト分類など) に適用できます。
入力
- 前のオペレーターからのデータセット。
- 前のオペレーターからの 1 つ以上のモデル。この入力はデータベースではオプションです。
構成
| パラメーター | 説明 |
|---|---|
| ノート | このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。 |
| 依存カラム | クラス変数として使用するカラムを定義します。 (Hadoop には存在しません) |
| 予測する値 | 値は分析するイベントを表します。 ノート: このカラムの値は、データベースに保存されているデータと一致する必要があり、データ エクスプローラーでの表示方法と一致する必要があります。たとえば、ブール値が含まれるカラムについて考えてみましょう。
|
| モデルを使用 | 評価で前のオペレーターのモデルを使用するか、入力データセットの予測カラムのデータを使用するかを指定します。
(Hadoop には存在しません) |
| 信頼度カラム | 依存カラムと比較する入力データセット内のカラムのリストを指定します。 (Hadoop には存在しません) |
出力
ビジュアル出力
ROC-AUC 図。

日付出力
なし。これはターミナル オペレーターです。