机器学习模型（一）k-近邻

转载

mob604756f2af3b 2021-10-12 13:30:00

导语：局部空间的线性拟合非线性（近邻分析，决策树），高维空间平面在低维空间的展示（例如：多项式；神经网络；SVM用核函数假装去高维）。

一、k-近邻

（一）步骤

1. 距离界定近邻

2. 参数k（调参）

p.s.改进：基于观测相似性的加权k近邻（权重用距离的倒数或核函数 e.g.均匀核函数或高斯核函数）

（二）图形表示

类似分段，但如果k越大或者样本量越大，越光滑。

（三）适用性

1、适用于维度较低的情况。随着空间维度p的增加，邻域局部性特征逐渐消失。

2、适用于输入变量为数值型的情况。会默认分类变量很重要。

从统计视角看k-近邻，是基函数的一个特例。

补充：回归样条中的k（节点数）和d（多项式的阶数）：k调节平滑程度，过大容易过拟合

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客