这章题目比较简单,主要是一些概念,但是实际内容还是挺多的。

1、与其他观测值的差别如此之大,以至于怀疑他是由不同的机制产生的,且是一个观测值的是(    )。

A边界点

B质心

C离群点

D核心点

2、一个对象的离群点得分是该对象周围密度的逆。这是基于(    )的离群点定义

A概率

B邻近度

C密度    

D聚类

3、离群点又被称为异常值,它的本质是(    )。

A数据对象

B特征

C 像素点

D一个数值

4、离群点分为全局离群点,(    )。

A部分离群点和条件离群点

B条件离群点和集体离群点

C部分离群点和集体离群点

D异常离群点和集体离群点

5、基于近邻的离群点检测方法包括基于距离的离群点检测和(    )。

A基于密度离群点检测

B基于位置的离群点检测

C基于数据的离群点检测

D基于概率的离群点检测

6、如果一个对象不强属于任何簇,那么该对象是(    )。

A基于距离的离群点

B基于统计的离群点

C基于聚类的离群点

D基于密度的离群点

7、下列属于基于统计的离群点检测流程的是( ABC   )。

A设定数据集的分布模型

B不和谐检验

C发现离群点

D验证离群点

8、检测一元正态分布中的离群点,属于异常检测中的基于(    )的离群点检测。

A统计方法

B邻近度

C 密度

D聚类技术

9、下列属于分类模型进行离群点检测的优势的是(    )。

A可以检测所有离群点

B不再需要数据和正常数据的距离

C建立在统计学原理上,易于理解

D当数据充分,检验十分有效

10、离群点又被称为异常值,它的本质是(    )。

A数据对象

B特征

C 像素点

D一个数值

11、使用基于分类的方法进行离群点的识别在实际应用中用的并不是很多,这是因为这种方式(    )。

A分类准确率不高

B训练代价高

C训练数据难以获取

D受训练数据的影响非常大

12、离群点可以是合法的数据对象或者(    )。

A数据关系

B特征

C像素点

D值

13、下列属于离群点的检测方法的是(  ABD  )。

A基于近邻的离群点检测

B 基于聚类的离群点检测

C基于应用价值的离群点检测

D基于分类的离群点检测;

14、下列属于离群点检测在数据挖掘中的应用的是(   BCD )。

老师课件里面提到:网络入侵、工业损毁、网络监视异常、医疗处理、欺诈检测

A市场营销管理

B网络监视异常

C工业损毁检测

D网络入侵检测

15、下列关于离群点与噪声的说法,错误的是(  ACD  )。

A观测值即是真实数据与噪声无关

B噪声指被观测数据的随机误差

C噪声是异常分析的研究对象

D噪声数据是一种离群点