デシジョン ツリー アルゴリズムの違い
CART、C4.5、ID3 などのさまざまなデシジョン ツリー アルゴリズムは、特定の詳細で異なります。
- 純度/不純物の測定方法と、どの純度のレベルで分割手順が停止されるか。すべてのリーフ ノードが完全に純粋になるまでトレーニング セットの分割を続けると、通常はモデルがオーバー フィッティングしてしまうことに注意してください。デシジョン ツリー オペレーターは、情報獲得を使用して純度の向上を測定します。CART オペレーターは、ジニ係数の改善を使用します。
- ツリーがバイナリであるか、または 2 つ以上の子を持つノードを持つことができるかどうか。
- 非カテゴリー属性がどのように扱われるか。