リフト(DB)

分類モデルのパフォーマンスを視覚化します。これは一般に、分類モデル (CART、デシジョン ツリー、ロジスティック回帰、ナイーブ ベイズ、ニューラル ネットワーク、アルパイン フォレストなど) に適用されます。

情報一覧

パラメーター

説明
カテゴリー モデルの検証
データ ソース タイプ DB
出力を他のオペレーターに送信 いいえ
データ処理ツール なし

累積ゲイン チャートは、指定されたサンプル数にわたってモデルによってキャプチャされたイベントの総数を示しますが、リフト カーブはランダムな推測に対するモデルの比率を示します。リフト チャートは、x 個のサンプルを与えた場合のランダムな推測と比較したモデルのパフォーマンスを示します。

たとえば、母集団の平均応答率が 1% であるが、特定のモデルによって応答率が 10% のセグメントが特定されたとします。このセグメントの「リフト」は 10.0 (10%/1%) です。

データの分位数をリフト別にランク付けすることで、どの領域が最もリフト量が多く、どの領域でモデルのパフォーマンスが最も優れているかがわかります。リフトの詳細と例については、こちらをご覧ください。

入力

  • 前のオペレーターからのデータセット。
  • オプション - 前述のオペレーターからの 1 つ以上のモデル。モデルは分類モデルである必要があります。以下のモデルがサポートされています。
    • カート
    • デシジョン ツリー
    • ロジスティック回帰
    • ナイーブ ベイズ
    • ニューラル ネットワーク
    • アルパイン フォレスト

構成

パラメーター 説明
ノート このオペレーターのパラメーター設定に関するメモまたは役立つ情報。 [ノート] フィールドに内容を入力すると、オペレーターに黄色のアスタリスクが表示されます。
依存カラム クラス変数として使用するカラムを定義します。
予測する値 分析するイベントを表す値。
ノート: このカラムの値は、データベースに保存されているデータと一致し、データ エクスプローラーでの表示方法と一致する必要があります。ユーザーが 1 と 0 を含むブール型の 依存カラム を定義する場合、ユーザーは 予測する値として 1 または 0 を使用する必要があります。列で True と False を使用する場合、ユーザーは 予測する値として「True」または「False」を使用する必要があります。
モデルを使用 評価で前のオペレーターのモデルを使用するか、入力データセットの予測カラムのデータを使用するかを指定します。 [true] の場合、少なくとも 1 つのモデル オペレーターをその直前に置く必要があります。 [false] の場合、予測列はその前のオペレーターからの入力データセットに存在する必要があります。

デフォルト値: true

信頼度列 依存カラムと比較する入力データセット内のカラムのリストを選択します。

出力

ビジュアル出力
リフトの図。前述のオペレーターによって複数のモデルが指定された場合に、モデルの比較に使用されます。

データ出力
なし。これはターミナル オペレーターです。