这章题目比较简单,主要是一些概念,但是实际内容还是挺多的。
1、与其他观测值的差别如此之大,以至于怀疑他是由不同的机制产生的,且是一个观测值的是( )。
A边界点
B质心
C离群点
D核心点
2、一个对象的离群点得分是该对象周围密度的逆。这是基于( )的离群点定义
A概率
B邻近度
C密度
D聚类
3、离群点又被称为异常值,它的本质是( )。
A数据对象
B特征
C 像素点
D一个数值
4、离群点分为全局离群点,( )。
A部分离群点和条件离群点
B条件离群点和集体离群点
C部分离群点和集体离群点
D异常离群点和集体离群点
5、基于近邻的离群点检测方法包括基于距离的离群点检测和( )。
A基于密度离群点检测
B基于位置的离群点检测
C基于数据的离群点检测
D基于概率的离群点检测
6、如果一个对象不强属于任何簇,那么该对象是( )。
A基于距离的离群点
B基于统计的离群点
C基于聚类的离群点
D基于密度的离群点
7、下列属于基于统计的离群点检测流程的是( ABC )。
A设定数据集的分布模型
B不和谐检验
C发现离群点
D验证离群点
8、检测一元正态分布中的离群点,属于异常检测中的基于( )的离群点检测。
A统计方法
B邻近度
C 密度
D聚类技术
9、下列属于分类模型进行离群点检测的优势的是( )。
A可以检测所有离群点
B不再需要数据和正常数据的距离
C建立在统计学原理上,易于理解
D当数据充分,检验十分有效
10、离群点又被称为异常值,它的本质是( )。
A数据对象
B特征
C 像素点
D一个数值
11、使用基于分类的方法进行离群点的识别在实际应用中用的并不是很多,这是因为这种方式( )。
A分类准确率不高
B训练代价高
C训练数据难以获取
D受训练数据的影响非常大
12、离群点可以是合法的数据对象或者( )。
A数据关系
B特征
C像素点
D值
13、下列属于离群点的检测方法的是( ABD )。
A基于近邻的离群点检测
B 基于聚类的离群点检测
C基于应用价值的离群点检测
D基于分类的离群点检测;
14、下列属于离群点检测在数据挖掘中的应用的是( BCD )。
老师课件里面提到:网络入侵、工业损毁、网络监视异常、医疗处理、欺诈检测
A市场营销管理
B网络监视异常
C工业损毁检测
D网络入侵检测
15、下列关于离群点与噪声的说法,错误的是( ACD )。
A观测值即是真实数据与噪声无关
B噪声指被观测数据的随机误差
C噪声是异常分析的研究对象
D噪声数据是一种离群点