2017-07-20 15:18:25

k*邻(k-Nearest Neighbour, 简称kNN)学*是一种常用的监督学*方法,其工作机制非常简单,对某个给定的测试样本,基于某种距离度量找出训练集中与其最靠*的k个训练样本,然后基于这k个‘邻居’的信息进行预测。一般来说,在分类中采用‘投票法’,即选择的这k个样本中出现最多的类别标记作为预测结果。

优点:精度高,对异常值不敏感,无数据输入假定;

缺点:计算复杂度高、空间复杂度高;(对每个输入测试样本,需要计算其和所有训练样本的距离,并从中选择k个最相*的)

适用的数据范围:连续型和离散型