总结 logistic回归,随机森林,AdaBoost,KNN,常用的机器学习算法

转载

寒月谷 2018-07-02 09:40:26

文章标签 机器学习 文章分类 机器学习人工智能

贝叶斯分类器

核心：将样本判定为后验概率最大的类

决策树

核心：一组嵌套的判定规则

KNN算法

核心：模板匹配，将样本分到离它最相似的样本所属的类

PCA

核心：向重构误差最小（方差最大）的方向做线性投影

LDA

核心：向最大化类间差异、最小化类内差异的方向线性投影

LLE（流形学习）

核心：用一个样本点的邻居的线性组合近似重构这个样本，将样本投影到低维空间中后依然保持这种线性组合关系

等距映射（流形学习）

核心：将样本投影到低维空间之后依然保持相对距离关系

人工神经网络

核心：一个多层的复合函数

支持向量机

核心：最大化分类间隔的线性分类器（不考虑核函数）

logistic回归

核心：直接从样本估计出它属于正负样本的概率

随机森林

核心：用有放回采样的样本训练多棵决策树，训练决策树的每个节点是只用了无放回抽样的部分特征，预测时用这些树的预测结果进行投票


AdaBoost算法

核心：用多棵决策树的线性组合来预测，训练时重点关注错分的样本，准确率高的弱分类器权重大


卷积神经网络

核心：一个共享权重的多层复合函数

循环神经网络

核心：综合了复合函数和递推数列的一个函数

K均值算法

核心：把样本分配到离它最近的类中心所属的类，类中心由属于这个类的所有样本确定

Kmeans --

优点：

原理简单
速度快
对大数据集有比较好的伸缩性

缺点：

需要指定聚类 数量K
对异常值敏感
对初始值敏感

refer : https://blog.csdn.net/sigai_csdn/article/details/80691609

上一篇：pandas和 excel 尝试

下一篇：pandas处理大数据的技巧

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

总结 logistic回归,随机森林,AdaBoost,KNN,常用的机器学习算法

总结 logistic回归,随机森林,AdaBoost,KNN,常用的机器学习算法

51CTO博客