基于距离的机器学习模型:

  K近邻:样本间的距离

  支持向量机:样本到决策面的距离

  层次聚类:不同簇之间的路基

  推荐系统:商品或用户相似度

  信息检索:查询和文档之间的相似度

 

 

 

 

 

 

 

 

 

 应对维度灾难:过度拟合和正则化

正则化:对学习算法的修改,接在减少泛化误差而不是训练误差