基于KNN模型的葡萄酒种类预测

关注是大魔术师

基于KNN模型的葡萄酒种类预测

转载

是大魔术师 2024-07-09 20:08:06

文章标签 基于KNN模型的葡萄酒种类预测机器学习人工智能取值数据 文章分类 机器学习人工智能

KNN分类模型

概念：

简单地说，K-近邻算法采用测量不同特征值之间的距离方法进行分类（k-Nearest Neighbor，KNN）

K值的作用

基于KNN模型的葡萄酒种类预测_机器学习

欧几里得距离（Euclidean Distance）

基于KNN模型的葡萄酒种类预测_取值_02

在scikit-learn苦中使用k-近邻算法
knn基于鸢尾花分类实现流程
分类问题：from sklearn.neighbors import KNeighborsClassifier
鸢尾花分类的实现

在knn中k的取值不同会直接导致分类结果的不同。n_beighbors参数就表示k值。
模型的超参数：如果模型参数有不同的取值且不同的取值会对模型的分类或者预测产生直系的影响。

预测年收入是否大于50K美元

对于非数值型数据职业进行one-hot编码进行特征值化

基于KNN模型的葡萄酒种类预测_基于KNN模型的葡萄酒种类预测_03

学习曲线寻找最优的k值

基于KNN模型的葡萄酒种类预测_取值_04

基于KNN模型的葡萄酒种类预测_机器学习_05

基于KNN模型的葡萄酒种类预测_机器学习_06

k-近邻算法之约会网站配对效果判定（datingTestSet.txt）

基于KNN模型的葡萄酒种类预测_机器学习_07

第一列数值比较大，需要进行归一化预处理，如果效果不好，可以使用标准化预处理。

基于KNN模型的葡萄酒种类预测_人工智能_08

基于KNN模型的葡萄酒种类预测_机器学习_09

基于KNN模型的葡萄酒种类预测_基于KNN模型的葡萄酒种类预测_10

基于KNN模型的葡萄酒种类预测_基于KNN模型的葡萄酒种类预测_11

问题：约会数据中发现目标数据为非数值行数据，可行吗？

可行！在knn算法原理中，仅仅是计算特征值之间的距离，目标数据并没有参与运算。

k的取值问题：学习曲线和交叉验证选取K值

K值较小，则模型复杂度较高，容易发生过拟合，学习的估计误差会增大，预测结果对近邻的实例点非常敏感。
K值较大可以减少学习的估计误差，但是学习的近似误差会增大，与输入实例较远的训练实例也会对预测器作用，使预测发生错误，k值增大模型的复杂度会下降。
在应用中，k值一半区一个比较小的值，通常采用交叉验证法来选取最优的k值。

适用场景：

小数据场景，样本为几千，几万的

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：ios tableview按需加载

下一篇：配置IDE查看kubernetes源码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册