离群点及其分析:

离群点与噪声的区别:

  • 离群点监测_数据

离群点类型:

离群点的类型:全局离群点、情境离群点、集体离群点。

离群点检测方法:

分类:

监督、半监督和无监督方法:

离群点监测_离群点监测_02

统计学方法:

离群点监测_数据_03

参数方法:【单变量,多变量,混合模型】

单变量:

离群点监测_离群点监测_04

多变量:

离群点监测_离群点监测_05

混合模型:

离群点监测_离群点监测_06

非参数方法:

离群点监测_数据_07

离群点监测_聚类_08

基于邻近性的方法:

基于距离:

Ø基于距离的离群点检测:数据对象o为离群点,当它的临近点的个数不足时。

居于密度:

Ø基于密度的离群点检测:数据对象o为离群点,当它的密度远低于其临近点的密度。

基于聚类的方法:

离群点的三种情形:

一个数据对象为离群点如果

(1)它不属于任何簇

(2)它离最近的簇的距离较大

(3)它属于一个小簇或稀疏簇

离群点监测_聚类_09

离群点监测_聚类_10