一个incredibly simple的分类器,基本原理是基于条件概率。要求:1. 特征值需要是可枚举的属性,例如布尔值,枚举值。对于连续的数值类型,在有的情况下可以根据特定逻辑划分范围,从而映射成为可枚举的属性。2. 特征之间需要“条件独立 (conditional distribution)”, 即:p(xi|y, xj ) = p(xi|y) (i != j)注意这里的条件独立的
说到决策树, 有几种类型分类树: 一种简单的分类算法,预测结果为离散的类型数据回归树:结果为数值类型CART(Classification And Regression Tree):以上二者的结合一般来说分类树的特点:PROS: 计算复杂度比较低, 对中间值缺失的容忍度较高,对预测值的类型没有要求CONS: 在生成决策树的时候需要考虑停止条件以防止overfitting,而这个决定通常没有一个准确
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号