9
关于HBase的三层结构中各层次的名称和作用的说法,哪个是错误的?
(2.0分)2.0 分
A、
Zookeeper文件记录了用户数据表的Region位置信息
B、
Zookeeper文件记录了-ROOT-表的位置信息
C、
-ROOT-表记录了.META.表的Region位置信息
D、
META.表保存了HBase中所有用户数据表的Region位置信息
正确答案: A 我的答案:A

hbase的三层 hbase的三层寻址是什么_hadoop

10下列哪一项不属于HDFS采用抽象的块概念带来的好处?(2.0分)0.0 分
A、
强大的跨平台兼容性
B、
适合数据备份
C、
简化系统设计
D、
支持大规模文件存储
正确答案: A 我的答案:C

12
在HBase访问接口中,Pig主要用在哪个场合
(2.0分)0.0 分
A、
适合其他异构系统在线访问HBase表数据
B、
适合Hadoop MapReduce作业并行批处理HBase表数据
C、
适合HBase管理使用
D、
适合做数据统计
正确答案: D 我的答案:C

8
以下HDFS相关的shell命令不正确的是
(3.0分)3.0 分
A、
hadoop fs -du 指定的文件或文件夹中所有文件的大小。
B、
hadoop fs -touchz 指定的非空文件
C、
hadoop fs -setrep [-R] 指定的文件的副本系数,-R选项用于递归改变目录下所有文件的副本系数。
D、
hadoop fs -getmerge [-nl] :清空回收站。
正确答案: BD 我的答案:BD

hadoop fs -touchz 指定的 空文件

hadoop fs -getmerge [-nl] :对src指定的源目录中的所有文件进行合并,写入localdst的本地文件中,也支持从标准输入中读取输入并写入目标文件系统

hadoop fs -expunge清空回收站

10
HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?
3.0分)3.0 分
A、
数据节点出错
B、
数据源太大
C、
名称节点出错
D、
数据出错
正确答案: ACD 我的答案:ACD

2关于HDFS Federation 的设计的描述,哪个是错误的?(2.0分)2.0 分
A、
HDFS的命名服务能够水平扩展
B、
设计了多个相互独立的名称节点
C、
属于不同命名空间的块可以构成同一个“块池”
D、
HDFS Federation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报
正确答案: C 我的答案:C

5
对HDFS通信协议的理解错误的是
(2.0分)2.0 分
A、
客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的
B、
客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互
C、
名称节点和数据节点之间则使用数据节点协议进行交互
D、
HDFS通信协议都是构建在IoT协议基础之上的
正确答案: D 我的答案:D

下列关于HDFS的描述,哪个不正确?(2.0分)2.0 分
A、
HDFS采用了冗余数据存储,增强了数据可靠性
B、
HDFS采用了主从(Master/Slave)结构模型
C、
HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
D、
HDFS采用块的概念,使得系统的设计变得更加复杂
正确答案: D 我的答案:D

8下面对FsImage的描述,哪个是错误的?(2.0分)2.0 分
A、
FsImage文件记录了每个块具体被存储在哪个数据节点
B、
FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
C、
FsImage文件没有记录每个块存储在哪个数据节点
D、
FsImage文件包含文件系统中所有目录和文件inode的序列化形式
正确答案: A 我的答案:A

6
HDFS要实现以下哪几个目标?
(4.0分)4.0 分
A、
支持大数据集
B、
支持流数据读写
C、
兼容廉价的硬件设备
D、
复杂的文件模型
正确答案: ABC 我的答案:ABC

9以下HDFS相关的shell命令正确的是(4.0分)0.0 分
A、
hadoop fs -moveFromLocal 在文件上传结束后会从本地文件系统中删除指定的文件
B、
hadoop fs -put 在文件上传结束后会从本地文件系统中删除指定的文件
C、
hadoop fs -put 从本地文件系统中复制指定的单个或多个源文件到指定的目标文件系统中。
D、
命令hadoop fs -moveFromLocal 与hadoop fs -put 的功能基本相同。
正确答案: CD 我的答案:BD

hadoop fs -moveFromLocal :与put命令功能相同,上传结束后,从本地删除localsrc指定的文件

10
以下关于Hadoop的HDFS描述正确的有?
(4.0分)2.0 分
A、
HDFS适合一次写入,多次读則的读写任务
B、
HDFS由NameNode,DataNode,Client组成
C、
HDFS备NameNode上的元数据是主NameNode同步过去的
D、
HDFS采用就近的机架节点进行数据的第一副本存储,
正确答案: ABD 我的答案:AB

5云计算平台层**(PaaS)**指的是什么?(2.0分)2.0 分
A、
从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型
B、
提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务
C、
操作系统和围绕特定应用的必需的服务
D、
将基础设施(计算资源和存储)作为服务出租
正确答案: C 我的答案:C

6下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?(2.0分)2.0 分
A、
利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
B、
把实时采集的数据作为流计算系统的输入,进行实时处理分析
C、
构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D、
利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
正确答案: D 我的答案:D

9在一个基本的Hadoop集群中,DataNode主要负责什么?(2.0分)2.0 分
A、
存储被拆分的数据块
B、
协调数据计算任务
C、
负责执行由JobTracker指派的任务
D、
负责协调集群中的数据存储
正确答案: A 我的答案:A

10第一次信息化浪潮主要解决什么问题?(2.0分)2.0 分
A、
信息传输
B、
信息爆炸
C、
信息处理
D、
信息转换
正确答案: C 我的答案:C

3
Hadoop3.0中引入的重要功能和优化包括
3.0分)0.0 分
A、
增加了HDFS HA新特性
B、
HDFS可擦除编码
C、
任务级别的MapReduce本地优化
D、
基于cgroup的内存和磁盘IO隔离等
E、
多名称节点支持
F、
新包含HDFS Federation和YARN两个系统
正确答案: BCDE 我的答案:CDF

5
以下关于云计算、大数据和物联网之间的关系,论述正确的是:
(3.0分)3.0 分
A、
物联网可以借助于大数据实现海量数据的分析
B、
云计算、大数据和物联网三者紧密相关,相辅相成
C、
物联网可以借助于云计算实现海量数据的存储
D、
云计算侧重于数据分析
正确答案: ABC 我的答案:ABC

7
TaskTracker与NameNode可以配置在同一台服务器上。
(2.0分)2.0 分
正确答案: × 我的答案: ×

7单选(2分)
上传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是:
得分/总分
A.
hdfs dfs -put /path file.txt
B.
hadoop dfs -put /path file.txt
C.
hdfs fs -put file.txt /path
D.
hdfs dfs -put file.txt /path
正确答案:D

8单选(2分) 在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是:

得分/总分

A. hdfs fs -mkdir -p /test/dir

B. hadoop fs -mkdir -p /test/dir

C. hdfs dfs *mkdir -p /test/dir

D. hadoop dfs -mkdir /test/dir

正确答案:B

10单选(2分)
已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary,{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是:

得分/总分

A. put ‘student’,‘2015001’,‘88’

B. put ‘student’,‘2015001’,‘math’,‘88’

C. put ‘student’,‘2015001’,‘score:math’,‘88’

D. put ‘student’,‘score:math’,‘88’

正确答案:C

12单选(2分) 在设计词频统计的MapReduce程序时,对于文本行“hello bigdata hello
hadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作):

得分/总分

A. <“hello”,2>、<“bigdata”,1>和<“hadoop”,1>

B. <“hello”,<1,1>>、<“bigdata”,1>和<“hadoop”,1>

C. <“hello”,1,1>、<“bigdata”,1>和<“hadoop”,1>

D. <“hello”,1>、<“hello”,1>、<“bigdata”,1>和<“hadoop”,1>

正确答案:D

13单选(2分) 假设已经配置好PATH环境变量,启动Hadoop的命令是:

得分/总分

A. start-hadoop.sh

B. start-dfs.sh

C. start-fs.sh

D. start-hdfs.sh

正确答案:B

14单选(2分) 下列说法错误的是:

得分/总分

A. 第二名称节点无法解决单点故障问题

B. 第二名称节点是热备份,而HDFS HA不是热备份

C. HDFS HA可以解决单点故障问题

D. HDFS Federation使得HDFS的命名服务能够水平扩展

正确答案:B

15单选(2分)
RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是:

得分/总分

A. map

B. groupBy

C. collect

D. join

正确答案:C

16单选(2分)
下列关于Hive的说法正确的是:

得分/总分

A. Hive支持频繁数据更新

B. Hive不支持索引

C. Hive的可扩展性差

D. Hive支持批量导入

正确答案:D

36判断(2分) 第二名称节点(Secondary
NameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。