分类与回归树算法(CART算法)与ID3、C5.0算法的区别、不同
CART(Classification and Regression Tree)算法,即分类与回归树算法,它是于1984年由Breiman、Friedman、Olshen和 Stone这4个人提出的。
该算法与ID3、C5.0算法的不同之处在于:
(1)该算法是一种建构二元分类与回归树的算法,即决策树在每次分叉时,只能分为两支。
(2)该算法在字段选择时,使用Gini Index(基尼系数)作为评估指标。
(3)C5.0算法是通过计算预估错误率来剪枝的,而CART算法是通过验证数据来剪枝的。简单来说,CART算法通过训练数据产生决策树,再用验证数据决定如何剪枝。