• 1、在 HBase 写数据的业务逻辑实现过程中、如下哪个接口或类是不需要涉及的?
    A、Put B、HTable C、HBaseAdmin D、PutList
    答案: C

  • 2、在 MapReduce 的应用程序开发中、下列哪个 JAVA 类负责管理和运行一个计算任务?
    A、lob B、Context C、FileSystem D、Configuration
    答案: A

  • 3、Fusionlnsight HD 中、Oozie 在提交作业前需要先上传本作业所依赖的配置文件和 jar 包到 HDFS
    A、正确 B、错误
    答案: A

  • 4、以下哪些方法可以生成 DStream 对象?
    A、KafkaUtils、createStream
    B、KafkaUtils、createDirectStream
    C、StreamingContext、socketStream
    D、StreamingContext、fileStream
    答案: ABCD

  • 5、Fusionlnsight HD 系统中、关于 Hive 提供的文件格式、哪个不是列式文件?
    A、CRC B、Parquet C、RCFile D、TextFile
    答案: D

  • 6、Fusionlnsight HD 中、对 Solr 各类资源的创建和读写权限使用、以下说法错误的是?
    A、 Solr 用户组用户可以创建配置集、并在创建 Collection 时指定该配置集
    B、 Solr 用户组的用户可以创建 Collection
    C、 Collection 创建者、对该Collection 具有读写权限的角色以及Solr admin角色可以对 Collection 进行更新
    D、 只有 Collection 创建者和 Solr admin 角色可以删除 Collection2
    答案: A

  • 7、在 Spark 中、以下哪项是对 DataFrame 取交集的算子?
    A、 filter condifionExpr: String: DataFrame
    B、 join right: DataFrame, join Exprs: Column: DataFrame
    C、 intersectother: DataFra me: Data Fra me
    D、 dropDuplicates : DataFrame
    答案: C

  • 8、通过 HBase 的 createTable 方法创建一张表、必须传入的参数有?
    A、表名 B、表名和列 C、表名和列族 D、可以为空
    答案: C

  • 9、HDFS 客户端所在节点的系统时间与 Fusionlnsight HD 集群的系统时间要保持一致、若有时间差、那么时间差应小于几分钟?
    A、5 B、10 C、20 D、30
    答案: A
  • 10、在 Flume 级联传输过程中、可以使用 fail over 模式传输、这样如果下一跳的 Flume 节点故障或者数据接受异常时、可以自动切换到另外一路上继续传输。
    A、正确 B、错误
    答案: A

  • 11、关于 Streaming 的拓扑、下面描述错误的是?
    A、 一个 Topology 是由一组 Spout 组件和 Bolt 组件通过 Stream Groupings 进行连接的有向无环图3DAG
    B、 Topology 会一直运行、直到它被显式 kill
    C、业务逻辑都被封装 Topology 中
    D、一个 Topology 只可以指定启动一个 Worker 进程
    答案: D

  • 12、HDFS 客户端以 N 副本向 HDFS 写文件时、若其中一个副本写入失败、则所有副本都会返回写入失败。
    A、正确 B、错误
    答案: B

  • 13、Fusionlnsight HD 中、使用 Streaming 的命令 ? 方式提交 example、jar 中的 om huawei example WrodCount 任务、任务名称为 wcTeat、以下执行命令正确的是?
    A、 storm jar example jar wcTest om huawei example WordCount
    B、 storm jar example jar wcTest WrodCount
    C、 storm jar example jar om huawei example WordCount wcTest
    D、 storm jar example jar WorkCount wcTest
    答案: C

  • 14、对于运行在 MapReduce 平台上的应用程序、此应用程序所依赖的 jar 包会被放到哪里?
    A、HIVE B、HBASE C、HDFS D、DB
    答案: C

  • 15、Fusionlnsiht HD 中、Oozie 客户端的 JAVA API 在运行任务时会调用 OozieClient 类的哪个方法?
    A、suspend B、getJoblnfo C、submit D、run
    答案: D

  • 16、将数据块存储大小设置为 128M、HDFS 客户端在写文件时、当写入一个 100M 大小的文件、实际占用储存空间为多大?
    A、128M B、100M C、64M D、50M
    答案: B

  • 17、当一个 MapReduce 应用程序被执行时、如下哪一个动作是 map 阶段之前发生的?
    A、split B、combine C、partition D、sort
    答案: A

  • 18、在 Fusionlnsight HD 产品中、Kafka 服务的角色名称是?
    A、Producer B、Broker C、Consumer D、ZooKeeper
    答案: B

  • 19、在 Fusionlnsight HD 集群中、Flume 不支持将采集数据写入到集群中那个服务?
    A、HDFS B、HBase C、Kafks D、Redis
    答案: D

  • 20、在 Spark 中、假设 lines 是一个 DStream 对象、以下哪个语句可以周期统计这个流上的单词数?
    A、 lines、flatMap_、split? ?、mapword=>word,1、reduce_+、print
    B、 lines、flatMap
    、split? ?、mapword=>word,word、length、reduceByKey_+、print
    C、 lines、flatMap
    、split? ?、mapword=>word,1、reduceByKey_+、print
    D、 lines、flatMap
    、split? ?、flatmapword=>word,1、groupByKey_+_、print
    答案: C