ROC

受信者動作特性 (ROC)、または ROC 曲線を生成します。

情報一覧

パラメーター

説明
カテゴリー モデルの検証
データ ソース タイプ HD、DB
出力を他のオペレーターに送信 いいえ
データ処理ツール MapReduce

ROC 曲線は、前のオペレーターから渡されたデータセットにアルゴリズムを適用することにより、前のモデル オペレーターから渡されたトレーニング済みモデルを検証および比較するために使用されます。ROC-AUC 法では、偽陽性率 (FP) と真陽性率 (TP) の座標ペアが考慮されます。この座標セットは、受信者動作特性 (ROC) 曲線を形成します。

ROC 曲線の値は、ROC 曲線下面積 (AUC) を計算することで要約できます。

通常、ランダム モデルには対角線に沿って延びる ROC 曲線があります。より優れたモデルは左上にカーブするため、AUC 値は 1 に近づきます。

このオペレーターは、一般に、任意の分類モデル (CART、デシジョン ツリー、ロジスティック回帰、ナイーブ ベイズ、ニューラル ネットワーク、アルパイン フォレスト分類など) に適用できます。

入力

  • 前のオペレーターからのデータセット。
  • 前のオペレーターからの 1 つ以上のモデル。この入力はデータベースではオプションです。

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
依存カラム クラス変数として使用するカラムを定義します。 (Hadoop には存在しません)
予測する値 値は分析するイベントを表します。
ノート: このカラムの値は、データベースに保存されているデータと一致する必要があり、データ エクスプローラーでの表示方法と一致する必要があります。たとえば、ブール値が含まれるカラムについて考えてみましょう。
  • 従属カラムがブール値を 1 と 0 で表す場合、ユーザーは予測する値にも 1 または 0 を使用しなければなりません。
  • 従属カラムがブール値を True と False で表現する場合、ユーザーは予測する値にも True または False を使用しなければなりません。
モデルを使用 評価で前のオペレーターのモデルを使用するか、入力データセットの予測カラムのデータを使用するかを指定します。
  • true (デフォルト) の場合、少なくとも 1 つのモデル オペレーターをその直前に置く必要があります。
  • false の場合、予測カラムはその前のオペレーターからの入力データセットに存在する必要があります。

(Hadoop には存在しません)

信頼度カラム 依存カラムと比較する入力データセット内のカラムのリストを指定します。 (Hadoop には存在しません)

出力

ビジュアル出力
ROC-AUC 図。

日付出力
なし。これはターミナル オペレーターです。