情報の獲得

デシジョン ツリー分析では、親ノードからその子ノードへのゲイン比が重要な概念になります。

ゲイン比 Δ は、次のように、サブセットの相対的なサイズによって重み付けされた、親から子への純度のゲインを測定します。

ここで、I はノードの純度 (または不純度) です。

N は子ノード j に割り当てられたエレメントの数です。

N は、親ノードのエレメントの総数です。

デシジョン ツリー アルゴリズムは、このゲイン比を最大化する分割を実行しようとします。