若泽数据@Hadoop 试题一单选题 1、Hadoop 的作者(C) A:Martin Fowler   #敏捷开发方法论-软件开发教父B:Kent Beck      #极限编程,测试驱动开发,实现模式C:Doug Cutting D:James Gosling  #java之父2、YARNWebUI 默认端口是(B
转载 2024-01-09 22:17:37
35阅读
简单描述你对Hadoop集群SafeMode模式的理解?集群处于安全模式,不能执行重要操作(写操作),集群属于只读状态。但是严格来说,只是保证HDFS元数据信息的访问,而不保证文件的访问。集群启动完成后,自动退出安全模式, 如果集群处于安全模式,想要完成写操作,需要离开安全模式。 (1)bin/hdfs dfsadmin -safemode get (功能描述:查看安全模式状态) (2)bin/h
NO.5 CORRECT TEXT(第五题 正确文本)Problem Scenario 13 : You have been given following mysql database details as well as other info.(问题场景13:已经提供了以下mysql数据库详细信息和其他信息) user=retail_dba password=cloudera database
转载 10月前
62阅读
电话面试,30多分钟,本次面试主要是面试我的意愿,基础能力,解决问题的能力。如果面试完觉得我不错的话会帮我推到阿里达摩院面试系统里面进行正式的面试流程。1. 首先是自我介绍,项目经历,实习经历,毕业的一些想法。2. 面试问答问题:问烟火检测怎么降低误报率(容易把红色的目标误检成火)。(因为我的简历上面我写了我做过烟火检测)回答:针对烟火数据难以收集的问题,尤其是小烟和小火,可以考虑使用GAN网络来
转载 2024-08-02 12:34:25
31阅读
  单项选择题  1. 下面哪个程序负责 HDFS 数据存储。  a)NameNode  b)Jobtracker  c)Datanode  d)secondaryNameNode  e)tasktracker  2. HDfS 中的 block 默认保存几份?  a)3 份  b)2 份  c)1 份  d)不确定  3. 下列哪个程序通常与 NameNode 在一个节点启动?a)Seconda
转载 2024-06-13 08:19:51
75阅读
问题1:char、varchar的区别是什么? varchar是变长而char的长度是固定的。如果你的内容是固定大小的,你会得到更好的性能。问题2: TRUNCATE和DELETE的区别是什么? DELETE命令从一个表中删除某一行,或多行,TRUNCATE命令永久地从表中删除每一行。问题3:什么是触发器,MySQL中都有哪些触发器? 触发器是指一段代码,当触发某个事件时,自动执行这些代码。在My
转载 2024-04-28 15:02:20
65阅读
hadoop相关面试题 以下未实际验证,可借鉴不可笃信。hadoop相关面试题1.hdfs写流程2.hdfs读流程3.hdfs的体系结构4.一个datanode 宕机,怎么一个流程恢复5.hadoop 的 namenode 宕机,怎么解决6.namenode对元数据的管理7.元数据的checkpoint8.yarn资源调度流程9.hadoop中combiner和partition的作用10.用ma
转载 2024-02-26 21:14:57
34阅读
一、单选题1、Shuffle中Partitioner 分区发生在哪个过程( A )A. 溢写过程B. 本地MergeC. reduce函数阶段D. map函数阶段 2、在整个maprduce运行阶段,数据是以(   A     )形式存在的A. key/valueB. LongWritableC.
转载 2023-07-13 11:15:57
123阅读
Shuffle过程环形缓冲区的作用:key,value从map()方法输出,被outputcollector收集通过getpartitioner()方法获取分区号,在进入环形缓冲区。默认情况下,环形缓冲区大小值为100MB。当map输入的数据进入环形缓冲区的量达到80MB以上时,那么开始执行溢写过程,溢写过程中如果有其他数据进入,那么由剩余的百分之20反向写入。溢写过程会根据key,value先进
转载 2024-05-17 12:58:13
39阅读
上一篇文章介绍了关于MySQL数据库基础题的一部分内容,很多朋友表示看着不过瘾,因此本文将更全面的把MySQL数据库基础题一并介绍完。除了基础题部分,小编计划收集整理的MySQL面试题还包括如下知识点或题型:MySQL高性能索引SQL语句MySQL查询优化MySQL高扩展高可用MySQL安全性为了避免收藏不看,让大家更有耐心看下去,印象更深刻些,小编将分五次分别发布这些内容,加上本文一共6篇,欢迎
转载 2024-04-14 22:01:00
44阅读
Hadoop常见面试题整理及解答一、基础知识篇:1.把数据仓库从传统关系型数据库转到hadoop有什么优势? 答: (1)关系型数据库成本高,且存储空间有限。而Hadoop使用较为廉价的机器存储数据,且Hadoop可以将大量机器构建成一个集群,并在集群中使用HDFS文件系统统一管理数据,极大的提高了数据的存储及处理能力。 (2)关系型数据库仅支持标准结构化数据格式,Hadoop不仅支持标准结
转载 2023-10-06 20:36:27
174阅读
共同点CHAR(M) 和 VARCHAR(M) 都表示该列能存储 M 个字符,注意不是字节!!CHAR类型特点CHAR 最多可以存储 255 个字符 (注意不是字节),字符有不同的编码集,比如 UTF8 编码 (3字节)、GBK 编码 (2字节) 等。对于 CHAR(M) 如果实际存储的数据长度小于M,则 MySQL 会自动会在它的右边用空格字符补足,但是在检索操作中那些填补出来的空格字符会被去掉
1、海量日志数据提取出某日访问百度次数最多的IP,怎么做?2、有一个1G大小的文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。3、更智能&更大的数据中心架构与传统的数据仓库架构有何不同?传统的企业数据仓库架构基于 Hadoop 的数据中心架构4、运行Hadoop集群需要哪些守护进程?DataNode,NameNode,TaskTracker和
转载 2023-11-13 06:34:30
91阅读
很多中间件,都用到了 Zookeeper,比如大数据相关那一群小伙伴Kafka、Hadoop、HBase。作为一个分布式协同管理插件,Zookeeper被很多公司使用。又是一不得不学习的技术啊,给大家准备了36个知识点或者说面试题,又可以收藏一波了。1.CAP理论?C : Consistency 一致性,数据在多个副本之间似否能够保持一致的特性。A: Availability 可用性,系统服务必须
转载 2023-12-27 13:12:40
45阅读
Hadoop是什么从HDFS、MR、Yarn进行讲解。HDFS的读写流程读流程: 写流程:MR任务中的Shuffle过程Map方法之后Reduce方法之前这段处理过程叫「Shuffle」Map方法之后,数据首先进入到分区方法,把数据标记好分区,然后把数据发送到环形缓冲区;环形缓冲区默认大小100m,环形缓冲区达到80%时,进行溢写;溢写前对数据进行排序,排序按照对key的索引进行字典顺序
转载 2024-05-23 15:19:20
58阅读
Linux 查看操作系统默认路由的命令是什么?https使用的端口是什么,如何查看端口号? https是什么协议mysql数据库默认端口是什么? 如何判断服务器上是否开启了mysql端口请写出export LANG =’en_US.UTF-8’这条命令的用途请写出echo 3 > /proc/sys/vm/drop_caches 这条命令的作用请写出find ./ -type f...
原创 2021-05-20 19:09:35
710阅读
Linux 查看操作系统默认路由的命令是什么?https使用的端口是什么,如何查看端口号? https是什么协议mysql数据库默认端口是什么? 如何判断服务器上是否开启了mysql端口请写出export LANG =’en_US.UTF-8’这条命令的用途请写出echo 3 > /proc/sys/vm/drop_caches 这条命令的作用请写出find ./ -type f...
原创 2022-03-09 15:43:08
79阅读
CRM系统是基于方法学、软件和互联网的以有组织的方式帮助企业管理客户关系的信息系统。( )准确地说明了CRM的定位。 A. CRM在注重提高客户的满意度的同时,一定要把帮助企业提高获取利润的能力作为重要指标 B. CRM有一个统一的以客户为中心的数据库,以方便对客户信息进行全方位的统一管理 C. CRM能够提供销售、客户服务和营销三个业务的自动化工具,具有整合各种客户联系渠道的能力 D. CRM
转载 2023-11-13 14:26:57
228阅读
一 概论    1、大数据5V特点Volume(大量)、Velocity(高速)、Variety(多样)、Value(低密度价值)、Veracity(真实性)   *2、Google三驾马车GFS(分布式文件系统)、MapReduce(超大集群的简单数据处理)、BigTable(结构化数据的分布式存储系统)   3、H
3、写一个a个字节对齐的宏正确答案:#pragma pack(a)   VC中提供了#pragma pack(n)宏,使我们可以屏蔽默认对齐方式,来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:第一、如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式,第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,...
原创 2021-09-29 09:44:15
311阅读
  • 1
  • 2
  • 3
  • 4
  • 5