离群点及其分析:
离群点与噪声的区别:
离群点类型:
离群点的类型:全局离群点、情境离群点、集体离群点。
离群点检测方法:
分类:
监督、半监督和无监督方法:
统计学方法:
参数方法:【单变量,多变量,混合模型】
单变量:
多变量:
混合模型:
非参数方法:
基于邻近性的方法:
基于距离:
Ø基于距离的离群点检测:数据对象o为离群点,当它的临近点的个数不足时。
居于密度:
Ø基于密度的离群点检测:数据对象o为离群点,当它的密度远低于其临近点的密度。
基于聚类的方法:
离群点的三种情形:
一个数据对象为离群点如果
(1)它不属于任何簇
(2)它离最近的簇的距离较大
(3)它属于一个小簇或稀疏簇