デシジョン ツリー結果のトラブルシューティング
デシジョン ツリー モデルの結果を分析するときは、最も重要な評価要素に留意してください。
デシジョン ツリーの評価
デシジョン ツリー モデルの結果を分析する場合、最も重要な評価要素は次のとおりです。
- トレーニング データの範囲外でも高いスコアが得られます (ROC、LIFT、および適合度スコアリング オペレーターによって示されます)。
- 単一ノード、繰り返し、不均衡なツリーのシナリオを回避しています。
- 簡単に解釈できます。
- 直感的に理解できます。
単一ツリー ノード、繰り返し、複製など、モデラーがデシジョン ツリー モデルの妥当性を疑問視するようなデシジョン ツリー オペレーターの出力結果がいくつかあります。
単一ノード ツリー、繰り返し、またはレプリケーション条件は、デシジョン ツリーの代わりに別の形式のモデリングを使用する必要があることをモデラーに示す場合があります。
単一ツリー ノード
いかなる分類構造も持たないデータの極端な場合、デシジョン ツリーの出力は、要素に最も頻繁に出現するクラスのラベルを割り当てる単一ノード ツリーになります。
繰り返し
デシジョン ツリーの出力で見られる可能性のあるもう 1 つの異常は、ツリーの特定のブランチに沿って属性が繰り返しテストされる、繰り返しのあるツリーです。たとえば、次のツリーは、ツリーの下位で属性 age がさまざまなしきい値と繰り返し比較されていることを示しています。

レプリケーション
注意すべきもう 1 つの問題は、ツリー内にレプリケーションまたは重複したサブ・ツリーが存在する場合です。この問題は、組み合わせ変数を作成することで解決できる可能性があります。あるいは、レプリケーションで許容可能なモデルになる可能性もあります。