您的当前位置:首页正文

CART树剪枝(二)

来源:要发发知识网

一、剪枝理论基础

二、剪枝四部曲

  • 1、代价函数复杂度
  • 2、非叶子节点的表面误差率增益率(误差增加的速度)公式推导(代价函数负责度的差):当多个非叶子节点的α值同时达到最小时,取|NTt|最大的进行剪枝。
  • 3、剪枝,得到一系列α的值和对应的子树序列T0,T1...
  • 4、交叉验证,选取最优α

1、代价函数复杂度

代价复杂函数

2、表面误差率增益率:最难以理解的一步

表面误差率公式

3、剪枝

剪枝

4、交叉验证

交叉验证

三、参考