文章目录

  • ​​1、什么K邻近算法​​
  • ​​2、使用鸢尾数据集样例​​

1、什么K邻近算法

K邻近算法的原理是寻找与待预测实例的各个特征最为相近的K个数据集中的样例,并以找到的K个样例的结果对待测样例作出估计,是基于距离的算法

2、使用鸢尾数据集样例

代码:

from sklearn import neighbors,datasets
from sklearn.model_selection import train_test_split

data = datasets.load_iris()
X = data.data
y =data.target

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.1,random_state=0)
#设置邻近数为5
clf = neighbors.KNeighborsClassifier(5)
#训练模型
clf.fit(X_train,y_train)
#为模型打分
print(clf.score(X_test,y_test))

#预测测试集的第一个位置的结果并输出预测结果的概率
print(clf.predict([X_test[0]]),y_test[0])
#因为这里有三个种类,所以predict_prob函数输出一个一行三列的数组
print(clf.predict_proba([X_test[0]]))