Spark Core面试篇01一、简答题1.Spark master使用zookeeper进行HA的,有哪些元数据保存在Zookeeper?答:spark通过这个参数spark.deploy.zookeeper.dir指定master元数据在zookeeper中保存的位置,包括Worker,Driver和Application以及Executors。standby节点要从zk中获得元数据信息,恢复
转载
2023-07-18 22:55:45
60阅读
文章目录一.spark的部署模式1.本地模式2.standalone模式3.spark on yarn模式二.driver的功能三.hadoop和spark都是并行计算,他们有什么相同点和不同点四.RDD五.简述宽依赖和窄依赖概念,groupByKey,reduceByKey,map,filter,union都是什么依赖?1.窄依赖2.宽依赖六.spark如何防止内存溢出1.driver端的内存
转载
2023-11-24 09:33:51
149阅读
一、你是怎么理解Spark,它的特点是什么? Spark是一个基于内存的,用于大规模数据处理(离线计算、实时计算、快速查询(交互式查询))的统一分析引擎。 它
转载
2023-10-28 17:03:38
95阅读
Hadoop/Spark相关面试问题总结 <!-- author: 小黑 date: 2015-07-16 title: Hadoop/Spark相关面试问题总结 tags: Others category: Others status: publish summary: Hadoop/Spark相
转载
2017-08-13 18:32:00
143阅读
2评论
在面试中,经常会问到spring相关的问题,bean的作用域及生命周期,AOP,IOC等一系列问题,平常开发可能经常用到,今天,总结了一下spring的主要知识点及面试经常遇到的问题。1:什么是spring? 2:Spring 的优点? 3:spring中bean的作用域? 4:spring中bean的生命周期? 5:bean的注入方式有哪些? 6:bean是线程安全的吗?为什么? 7:谈谈对AO
转载
2023-12-30 22:02:20
58阅读
网络管理员的面试题[要求CCNA MCSE]网络管理员的面试题[要求CCNA MCSE]
1、指出以下服务所默认的端口号。(6分) FTP: Telnet: POP3: SMTP: PCAnyWhere: Windows终端服务:
2、将一台服务器装上Win 2000 Server系统,在安全性设置上,你会如何操作:(10分)
3、ICS与NAT在共享上网上的区别:(6分)
4、VL
转载
精选
2008-09-28 11:43:57
674阅读
以下一些问题及其答案,仅代表我个人观点,仅供参考,但是如果你遇到问这些问题的很可能就是我在面你。
转载
2022-12-08 00:01:09
232阅读
你有什么问题要问吗? 1.不要不问问题 2.提出能加分的问题 包含3个要素,分别是:基于对方、回=
原创
2022-09-03 01:27:25
168阅读
1.请用3分钟时间做自我介绍(中文)2.你为什么申请这份工作(面试的范围)3.你对我们公司有哪些了解,你为什么要为我们工作?4.你认为你的优点是什么,缺点是什么?5.你在选择工作中更看中什么(成长的空间、培训机会、发挥的平台,薪资等)6.如果不把薪资放在第一位时,你心中的薪资是多少?(那你刚才的意思也可以这样理解:薪资方面可以适当低于您的心理预期,对吗?(若薪资显得不太让步,可问)有人说挣未来比挣
转载
精选
2009-01-24 13:38:03
798阅读
1. 某某公司也在招聘,有适合您的职位,为什么不去呢? 投了简历了,还没有去面试。 2. 跳槽的原因? 曾有调查表明,目前在面试中常见的离职原因包括:人际关系不好处理、收入不合期望、与上司相处不好、工作压力大等。但从企业招聘方来看,这些原因都或多或少包含求职者本身的因素,可能影响将来的工作发挥,如与同事及客户的人际关系、薪..
转载
2007-08-04 11:46:00
191阅读
2评论
1.防止订单重复提交 使用 redis 分布式锁来实现,可以使用用户ID,加购物车的商品ID,使用 MD5算法,得出一个key 作为分布式锁
原创
2024-10-29 12:03:06
50阅读
1、什么是宽依赖,什么是窄依赖?哪些算子是宽依赖,哪些是窄依赖? 窄依赖就是一个父RDD分区对应一个子RDD分区,如map,filter 或者多个父RDD分区对应一个子RDD分区,如co-partioned join宽依赖是一个父RDD分区对应非全部的子RDD分区,如groupByKey,ruduceByKey 或者一个父RDD分区对应全部的子RDD分区,如未经协同划分的join https://
转载
2023-09-05 16:28:42
126阅读
1.Redis 面试题 1、什么是 Redis? 2、Redis 的数据类型? 3、使用 Redis 有哪些好处? 4、Redis 相比 Memcached 有哪些优势? 5、Memcache 与 Redis 的区别都有哪些? 6、Redis 是单进程单线程的? 7、一个字符串类型的值能存储最大容量是多少? 8、Redis 的持久化机制是什么?各自的优缺点? 9、Redis 常见性能问题和解决方案
转载
2023-07-21 22:36:32
117阅读
1.什么是Springspring是一个轻量级的控制反转(IoC)和面向切面(AOP)的容器框架从大小与开销而言是轻量级的通过控制反转的技术达到松耦合的目的通过面向切面,允许通过分离应用的业务逻辑与系统即服务进行内聚性开发包含并管理应用对象Bean的配置和生命周期,这个意义上是一个容器将简单的组建配置,组合成复杂的应用,这个意义上是一个框架2.谈谈你对AOP的理解 AOP--面向切面编程:能够将那
转载
2024-03-20 10:29:19
232阅读
并非所有的访谈都将重点放在算法和数据结构上–通常,访谈通常只侧重于您声称是专家的语言或技术。在此类访谈中,通常不会出现任何“陷阱”问题,它们要求您利用内存和使用该语言的经验–换句话说,它们测试您对编程语言的了解。 但是,忘记像Java这样的语言的所有来龙去脉很容易,因为简单地说,我们不会处理诸如“ JVM管理哪种内存?”这样的问题。 和“用示例描述多态”。 以一天为周期。 这篇文章概述了
转载
2023-09-18 17:49:46
116阅读
1 什么是hive?Hive 是基于Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL 查询功能。 本质是:将HQL 转化成MapReduce 程序1)Hive 处理的数据存储在HDFS2)Hive 分析数据底层的实现是MapReduce3)执行程序运行在Yarn 上2 Hive的优缺点优点:1 操作接口采用类SQL 语法,提供快速开发的能力(简单、容易上手)。2
转载
2023-09-04 16:24:17
0阅读
目录一. Spark有几种部署方式?请分别简要论述二. Spark提交作业参数三. 如何理解Spark中RDD的血缘关系?四. 简述Spark的宽窄依赖,以及Spark如何划分stage,每个stage又根据什么决定task个数?五. 请列举Spark的transformation算子,并简述功能七. 请描述Repartition和Coalesce联系与区别八. 分别简述Spark中的缓存机制与c
转载
2023-08-21 12:50:38
365阅读
1.hbase怎么预分区?2.hbase怎么给web前台提供接口来访问?3.htable API有没有线程安全
转载
2022-11-03 14:12:52
773阅读
A所有的hive任务都会有reducer的执行吗?答:不是,由于当前hive的优化,使得一般简单的任
原创
2022-11-03 14:23:03
497阅读
文章目录1.谈谈项目中mq的理解2.mq宕机消息会丢失吗3.消息堆积问题4.mq的集群如何解决消息顺序执行问题5.数据一致性问题6.canal运行原理7
原创
2022-05-26 01:23:24
645阅读