KNN算法的描述:
(1)计算测试数据与各个训练数据之间的距离;
(2)按照距离的递增关系进行排序;
(3)选取距离最小的K个点;
(4)确定前K个点所在类别的出现频率
(5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。
算法优点:
(1)简单,易于理解,易于实现,
1、KNN可以处理分类问题,同时天然可以处理多分类问题,比如鸢尾花的分类,KNN还可以处理回归问题,也就是预测
准确度高,对异常值不是很敏感
**算法缺点:
1、效率低,因为每一次分类或者回归,都要把训练数据和测试数据都算一遍,如果数据量很大的话,需要的算力会很惊人
KNN对于多维度的数据处理也不是很好,看似相近的两个点之间,距离越来越大