我有个同学最近在学Mysql数据库,为了测试自己的学习成果,他们老大出了6道Mysql试题让他去做,晚上回来他又分享给我,我感觉非常经典,记录了这几道试题已及答案。 将测试数据表导入数据库,其中name字段代表“姓名”,score字段代表“分数”。 create table `t1` (  &nb
原创 2012-05-21 21:42:04
10000+阅读
2点赞
1评论
问:怎样在Http连接中设置超时和代理?Http连接的超时机制能够防止连接线程的无限期等待,一般可分为connect
原创 2022-09-22 21:20:06
87阅读
关于基础:1:内存泄漏是什么?什么时候会出现内存泄漏?2:单例模式和多线程有关系吗?3:容器中有几个接口,hash命令8:多线程,并发9:...
原创 2022-09-27 12:21:15
110阅读
    我有个同学最近在学Mysql数据库,为了测试自己的学习成果,他们老大出了6道Mysql试题让他去做,晚上回来他又分享给我,我感觉非常经典,记录了这几道试题已及答案。将测试数据表导入数据库,其中name字段代表“姓名”,score字段代表“分数”。create table `t1` (    `id` double , &
转载 精选 2014-07-04 18:36:00
468阅读
面试中,你会被问到的问题将是:关于你,你的技能和经验的一般问题关于特定工作的具体问题 - 有时称为技术问题对于许多不同类型的工作,一般问题可以是相同的。以下是一些可以被问到的常见问题。1.你的技能您的面试官想知道您是否具备完成工作的技能,因此他们可能会问:你的优势和弱势是什么?你的同事和朋友会说你最好的品质是什么?我们为什么应该录用你?了解自己的优势,并提及与您正在接受面试的工作相
SortShuffle1 mapTask将map(聚合算子)或array(join算子)写入内存2 达到阀值发生溢写,溢写前根据key排序,分批写入磁盘,最终将所有临时文件合并成一个最终文件,并建立一份索引记录分区信息。一个mapTask最终形成一个文件。3 reduceTask拉取各个task中自己的分区数据去计算。和hadoop shuffle的区别1 MR没有所谓的DAG划分,一次MR任务就
转载 2023-07-17 22:41:34
85阅读
1. kafka分区数如何设置?默认情况下 1 指定分区,按你指定的分区 2 未指定分区,但是指定了key,依据key的hashCode计算分区 3 未指定分区,且没有指定key,依据轮询算法计算分区2. kafka中消息传输一致中的最多一次、最少一次、恰好一次,是如何实现的?恰好一次:acks=-1 ,幂等机制 最多一次:acks=0 最少一次:acks=-1 or acks=13. Spark
转载 2024-02-17 09:35:04
93阅读
 Spark应用转换流程1、 spark应用提交后,经历了一系列的转换,最后成为task在每个节点上执行2、 RDD的Action算子触发Job的提交,生成RDD DAG3、 由DAGScheduler将RDD DAG转化为Stage DAG,每个Stage中产生相应的Task集合4、 TaskScheduler将任务分发到Executor执行5、
转载 2024-08-16 13:27:22
225阅读
一、什么是宽依赖,什么是窄依赖,哪些算子是宽依赖,哪些是窄依赖1、宽依赖:一个分区对应多个分区,这就表明有shuffle过程,父分区数据经过shuffle过程的hash分区器划分子rdd。例如:groupbykey   reducebykey   sortbykey等操作,shuffle可以理解为数据从原分区打乱重组到新分区2、窄依赖:一个分区对应一个分区,
转载 2023-08-11 17:17:03
136阅读
为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们开始spark+kafka:一般情况下面试的时候只要涉及到实时计算或者大批量计算,都会涉及到kafka和spark面试问题,两者一般是综合起来的的,因此我把他们放在一起进行总结,这一块的问题会比较多,将分不同纬度多次总结。 1)spark的执行流程?1.构建Spark Application的
转载 2023-10-20 22:13:54
71阅读
写文章 Spark面试题(一) runzhliu 丁香园 大数据研发工程师 42 人 赞同了该文章这部分的关于 Spark面试题是我
文章目录1、集群的最主要瓶颈2、Hadoop运行模式3、Hadoop生态圈的组件并做简要描述4、解释“hadoop”和“hadoop 生态系统”两个概念5、请列出正常工作的Hadoop集群中Hadoop都分别需要启动哪些进程,它们的作用分别是什么?6、基于 Hadoop 生态系统对比传统数据仓库有何优势?7、如何选择不同的文件格式存储和处理数据CSV 文件JSON 文件Avro 文件Column
转载 2023-07-13 16:44:15
266阅读
1、Fetch抓取Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECTFROMemployees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。在hivedefault.xml.template文件中hive.fetch.task.conversion默认是more,老版本hive默认是mini
原创 精选 2021-10-24 14:35:48
10000+阅读
1点赞
1.使用RabbitMQ有什么好处? 1.解耦,系统A在代码中直接调用系统B和系统C的代码,如果将来D系统接入,系统A还需要修改代码,过于麻烦! 2.异步,将消息写入消息队列,非必要的业务逻辑以异步的方式运行,加快响应速度 3.削峰,并发量大的时候,所有的请求直接怼到数据库,造成数据库连接异常 2. ...
转载 2021-07-20 14:40:00
361阅读
2评论
洪流学堂,让你快人几步。整理了一些Unity面试题目,希望可以帮助到你。面
原创 2023-04-12 15:17:38
202阅读
洪流学堂,让你快人几步。今天整理了一些Unity面试题目,希望可以帮助到
原创 2023-04-12 15:22:58
243阅读
一、电话面试开场白1、你先简短地介绍一下自己2、你是怎么学习前端的(红宝书?犀牛书?博客?社群?github、segmentfault、v2ex、stackoverflow ...)3、怎么才算一个好的前端开发者(沟通、设计、交互、特效、兼容、封装、造轮子 ...)4、谈一谈你未来三五年的职业规划(资深WEB前端工程师?资深WEB架构师?转岗管理或其他?自己创业?...) ...
原创 2022-01-13 17:41:44
283阅读
1、Hive表关联查询,如何解决数据倾斜的问题?(☆☆☆☆☆) 1)倾斜原因:map输出数据按keyHash的分配到reduce中,由于key分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce上的数据量差异过大。 (1)key分布不均匀; (2)业务数据本身的特性; (3)建表时考虑不周; (4)某些SQL语句本身就有数据倾斜;
原创 2021-10-23 11:00:59
10000+阅读
3点赞
1评论
近期在面试找工作的小伙伴们很多啊,我周围就有好几个认识的朋友在找工作,于是我
原创 2020-05-10 17:06:57
82阅读
这道题应该算是我原创的的一道题,于我遇到的一个具体需求。
原创 2022-09-02 23:32:27
190阅读
  • 1
  • 2
  • 3
  • 4
  • 5