当今时代,跳槽确实是大部分人升职加薪最快方式,特别是职业生涯初期。说起来也是很无奈,公司经常是宁愿花更多钱来请个新人也不愿意加薪留住老人。 面试了 N 多公司之后,我发现其实问来问去也就那几个知识点,所以干脆把热点知识系统性地总结了一下,共有 185 道题目,希望能够帮助各位为面试做足准备,完美应对面试各种灵魂拷问,一举拿下心仪 Offer ! 这些面试题主要分为六个部
转载 2023-11-09 17:21:48
97阅读
面试官最爱问Kakfa,基础+进阶+高级,疯狂轰炸!Kafka是一种高吞吐分布式发布订阅消息系统,它可以处理消费者规模网站中所有动作流数据。 这种动作(网页浏览,搜索和其他用户行动)是在现代网络上许多社会功能一个关键因素。 这些数据通常是由于吞吐要求而通过处理日志和日志聚合来解决。 对于像Hadoop一样日志数据和离线分析系统,但又要求实时处理限制,这是一个可行解决方案
2019已经到来,你是否在满意公司?拿着理想薪水?目前全国正处于招聘高峰期,如果有面试题能提示一下,可以提前做个准备,也可以看出自己不足之处,面试能拿到offer机会就大多,下面就是一些常见大数据面试题,希望能够帮到大家:1.kafka集群规模,消费速度是多少。答:一般中小型公司是10个节点,每秒20M左右。2.hdfs上传文件流程。答:这里描述 是一个256M文件上传过程①
转载 2024-08-26 10:08:01
95阅读
文章目录一.HashMapjdk7:数组+链表jdk8:数组+链表+红黑树jdk7和jdk8对比如下二.面向对象特征1.继承2.封装3.多态三.Error和Exception区别四.说明Java中反射实现过程和作用分别是什么五.HashMap和HashTable区别六.TreeSet和HashSet区别七.StringBuffer和StringBuilder区别八.关键字final,f
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多那个IP。首先是这一天,并且是访问百度日志中IP取出来,逐个写入到一个大文件中。注意到IP是32位,最多有个2^32个IP。同样可以采用映射方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大IP(可以采用hash_map进行频率统计,然后再找出频率最大 几个)及相应频率
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多那个IP。首先是这一天,并且是访问百度日志中IP取出来,逐个写入到一个大文件中。注意到IP是32位,最多有个2^32个IP。同样可以采用映射方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大IP(可以采用hash_map进行频率统计,然后再找出频率最大 几个)及相应频率
转载 2017-10-05 20:40:00
243阅读
2评论
腾讯一面  试下   4月6日  挂1 自我介绍2 介绍一下你在项目中承担任务3 你对哪种语言熟悉4 线程池使用过吧,说说线程池中有哪些关键字 具体使用方法。5  说说hashMap 使用是哪种数据结构,6说说hashMap 和 ConcurrentHashMap 区别7为啥hashMap是线程不安全? 8锁机制怎么使用?9如
以下为整理自己秋招遇到面试题;主要是Java和大数据相关题型;根据印象整理了下,有些记不起来了。死锁、乐观锁、悲观锁synchronized底层原理及膨胀机制ReetrantLock底层原理,源码是如何实现公平和非公平synchronized和lock区别volitale理解?volitale保证可见性意义什么是指令重排序,为什么要禁止指令重排序介绍java中基本数据类型及所占大小2
转载 2024-08-27 20:51:51
38阅读
1.String 和StringBuffer区别 JAVA平台提供了两个类:String和StringBuffer,它们可以储存和操作字符串,即包含多个字符字符数据这个String类提供了数值不可改变字符串而这个StringBuffer类提供字符串进行修改当你知道字符数据要改变时候你就可以使用StringBuffer典型地,你可以使用Strin
sql面试题(三)11.描述有一个员工表dept_emp简况如下:第一行表示为员工编号为10001部门是d001部门。有一个部门经理表dept_manager简况如下:第一行表示为d001部门经理是编号为10002员工。获取所有的员工和员工对应经理,如果员工本身是经理的话则不显示,以上例子如下:SELECT t1.emp_no, t2.emp_no manager FROM dept_em
# Java数据量面试题_海量数据面试题集锦实现流程 ## 概述 本文旨在教会刚入行小白如何实现“java数据量面试题_海量数据面试题集锦”。通过以下步骤来完成任务: 1. 数据预处理:生成海量数据 2. 数据读取:将海量数据按照合适方式读取到内存中 3. 数据处理:对内存中数据进行相应处理 4. 数据结果输出:将处理后结果输出 ## 实现流程 ```mermaid flowch
原创 2023-09-28 17:51:23
53阅读
1.数组面试问题数组是最基本数据结构,它将元素存储在连续内存位置。这也是采访者一个主要话题,你会在任何编码访谈中听到很多关于数组问题,例如反转数组,排序数组或搜索数组中元素。如何在给定1到100整数数组中找到缺失数字?如何在给定整数数组上找到重复数字?如何在未排序整数数组中找到最大和最小数字?你如何找到所有对整数数组,其总和等于给定数字?如果数组包含多个重复项,如何在数
转载 2024-10-27 09:55:32
21阅读
在离线数据开发模块,用户可以在 sql 编辑器中编写 sql,再通过整段运行/分段运行来执行 sql。在点击整段运行后,运
原创 精选 2023-10-03 09:21:23
521阅读
作者:撩人羊 第一部分:海量数据处理1.寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用所有检索串都记录下来,每个查询串长度为1-255字节。假设目前有一千万个记录,这些查询串重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串重复度越高,说明查询它用户越多,也就是越热门。请你统计最热门10个查询串,要求使用内存不能超过1G。(1
文章目录前言一、考察SQL能力*初级*1. 表A只有一个字段ID,值为[1,2,2,3,3,3]。现要求查询出重复id2.表A又两个字段ID和Create_Time,计算今天新增ID表[不包含昨天那一部分];3. 表A和表B都只有一个字段Account,如果account来自A则输出red,来自B则输出blue;4. 计算字符串'ABCABC' 中字符A个数*高级*5. 表A有两个字段I
大数据SQL面试题本套SQL题答案是由许多小伙伴共同贡献,1+1力量是远远大于2,有不少题目都采用了非常巧妙解法,也有不少题目有多种解法。本套大数据SQL题不仅题目丰富多样,答案更是精彩绝伦!注:以下参考答案都经过简单数据场景进行测试通过,但并未测试其他复杂情况。本文档SQL主要使用Hive SQL。#一、行列转换描述:表中记录了各年份各部门平均绩效考核成绩。 表名:t1 表结构:a
转载 2023-08-11 21:46:21
141阅读
1、​​Kafka​​ 都有哪些特点?高吞吐、低延迟:kafka每秒可以处理几十万条消息,它延迟最低只有几毫秒,每个topic可以分多个partition, consumer group 对partition进行consume操作。可扩展性:kafka集群支持热扩展持久性、可靠性:消息被持久化到本地磁盘,并且支持数据备份防止数据丢失容错性:允许集群中节点失败(若副本数量为n,则允许n
原创 精选 2022-09-11 18:11:43
1014阅读
1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文
转载 2023-07-11 09:31:12
376阅读
大数据面试题下列哪个程序通常与 NameNode 在一个节点启动?答案D A)SecondaryNameNode B)DataNode C)TaskTracker D)Jobtracker 解析:hadoop集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,...
原创 2022-01-28 14:23:01
289阅读
Hashing  适用范围:快速查找,删除基本数据结构,通常需要总数据量可以放入内存  基本原理及要点: hash函数选择,针对字符串,整数,排列,具体相应hash方法。  碰撞处理,一种是open hashing,也称为拉链法;另一种就是closed hashing,也称开地址法,opened addressing。
  • 1
  • 2
  • 3
  • 4
  • 5