当今时代,跳槽确实是大部分人升职加薪最快的方式,特别是职业生涯初期。说起来也是很无奈,公司经常是宁愿花更多的钱来请个新人也不愿意加薪留住老人。 面试了 N 多公司之后,我发现其实问来问去也就那几个知识点,所以干脆把热点知识系统性地总结了一下,共有 185 道题目,希望能够帮助各位为面试做足准备,完美应对面试官的各种灵魂拷问,一举拿下心仪 Offer ! 这些面试题主要分为六个部
转载 2023-11-09 17:21:48
97阅读
面试官最爱问的Kakfa,基础+进阶+高级,疯狂轰炸!Kafka是一种高吞吐的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案
1.String 和StringBuffer的区别 JAVA平台提供了两个类:String和StringBuffer,它们可以储存和操作字符串,即包含多个字符的字符数据这个String类提供了数值不可改变字符串而这个StringBuffer类提供的字符串进行修改当你知道字符数据要改变的时候你就可以使用StringBuffer典型地,你可以使用Strin
文章目录一.HashMapjdk7:数组+链表jdk8:数组+链表+红黑树jdk7和jdk8的对比如下二.面向对象的特征1.继承2.封装3.多态三.Error和Exception的区别四.说明Java中反射的实现过程和作用分别是什么五.HashMap和HashTable区别六.TreeSet和HashSet区别七.StringBuffer和StringBuilder的区别八.关键字final,f
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几个)及相应的频率
以下为整理的自己秋招遇到的面试题;主要是Java大数据相关题型;根据印象整理了下,有些记不起来了。死锁、乐观锁、悲观锁synchronized底层原理及膨胀机制ReetrantLock底层原理,源码是如何实现公平和非公平的synchronized和lock的区别volitale理解?volitale保证可见性的意义什么是指令重排序,为什么要禁止指令重排序介绍java中的基本数据类型及所占大小2的
转载 2024-08-27 20:51:51
38阅读
2019已经到来,你是否在满意的公司?拿着理想的薪水?目前全国正处于招聘的高峰期,如果有面试题能提示一下,可以提前做个准备,也可以看出自己的不足之处,面试能拿到offer的机会就大的多,下面就是一些常见的大数据面试题,希望能够帮到大家:1.kafka集群的规模,消费速度是多少。答:一般中小型公司是10个节点,每秒20M左右。2.hdfs上传文件的流程。答:这里描述的 是一个256M的文件上传过程①
转载 2024-08-26 10:08:01
95阅读
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几个)及相应的频率
转载 2017-10-05 20:40:00
243阅读
2评论
腾讯一面  试下   4月6日  挂1 自我介绍2 介绍一下你在项目中的承担的任务3 你对哪种语言熟悉4 线程池使用过吧,说说线程池中有哪些关键字 具体使用方法。5  说说hashMap 使用的是哪种数据结构,6说说hashMap 和 ConcurrentHashMap 的区别7为啥hashMap是线程不安全的? 8锁机制怎么使用的?9如
sql面试题(三)11.描述有一个员工表dept_emp简况如下:第一行表示为员工编号为10001的部门是d001部门。有一个部门经理表dept_manager简况如下:第一行表示为d001部门的经理是编号为10002的员工。获取所有的员工和员工对应的经理,如果员工本身是经理的话则不显示,以上例子如下:SELECT t1.emp_no, t2.emp_no manager FROM dept_em
Hashing  适用范围:快速查找,删除的基本数据结构,通常需要总数据量可以放入内存  基本原理及要点: hash函数选择,针对字符串,整数,排列,具体相应的hash方法。  碰撞处理,一种是open hashing,也称为拉链法;另一种就是closed hashing,也称开地址法,opened addressing。
# Java数据量面试题_海量数据面试题集锦实现流程 ## 概述 本文旨在教会刚入行的小白如何实现“java数据量面试题_海量数据面试题集锦”。通过以下步骤来完成任务: 1. 数据处理:生成海量数据 2. 数据读取:将海量数据按照合适的方式读取到内存中 3. 数据处理:对内存中的数据进行相应的处理 4. 数据结果输出:将处理后的结果输出 ## 实现流程 ```mermaid flowch
原创 2023-09-28 17:51:23
53阅读
1.数组面试问题数组是最基本的数据结构,它将元素存储在连续的内存位置。这也是采访者的一个主要话题,你会在任何编码访谈中听到很多关于数组的问题,例如反转数组,排序数组或搜索数组中的元素。如何在给定的1到100的整数数组中找到缺失的数字?如何在给定的整数数组上找到重复的数字?如何在未排序的整数数组中找到最大和最小的数字?你如何找到所有对的整数数组,其总和等于给定的数字?如果数组包含多个重复项,如何在数
转载 2024-10-27 09:55:32
21阅读
前言在开发过程中可能会碰到某些独特的业务,比如查询全部表数据数据量过多会导致查询变得十分缓慢。虽然在大多数情况下并不需要查询所有的数据,而是通过分页或缓存的形式去减少或者避免这个问题,但是仍然存在需要这样的场景,比如需要导出所有的数据到excel中,导出数据之前,肯定需要先查询表中数据,这个查询的过程中数据量一旦过大,单线程查询数据会严重影响程序性能,有可能过长的查询时间导致服务宕机。现在模拟使
转载 2023-06-15 09:47:19
1380阅读
2019独角兽企业重金招聘Python工程师标准>>> 大数据处理问题 场景:我说的大数据量处理是指同时需要对数据进行检索查询,同时有高并发的增删改操作; 对于大数据量处理,如果是互联网处理的话,一般分为下面阶段:第一阶段:所有数据都装入一个数据库,当数据量大了肯定就会出现问题,如几百万条数据,那时一个检索查询可以让你等你分钟;第二阶段:那时肯定想做缓存机制,确实可
作者:撩人的羊 第一部分:海量数据处理1.寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。(1
在离线的数据开发模块,用户可以在 sql 编辑器中编写 sql,再通过整段运行/分段运行来执行 sql。在点击整段运行后,运
原创 精选 2023-10-03 09:21:23
521阅读
1、给一个超过100G大小的log file ,log中存着IP地址,设计算法找到出现次数最多的IP地址?我们先考虑一下,100G大小的文件,一般是无法存到普通的计算机中的,我们的硬盘根本没这
原创 2022-11-04 10:49:49
303阅读
进入到eclipse界面第一步:file->new->java project->起名->finish第二步:进入到刚才建的工程里,右键src->new->package->起名->finish第三步:进入到刚才建的package里,右键name->new->class->起名(这里起名要注意,因为比赛时如果交java代码,这里的
转载 2023-12-29 14:15:01
76阅读
作者:禅与计算机程序设计艺术 1.背景介绍 数据结构与算法(英语:Data Structures and Algorithms),是指相互之间存在着一种或多种关系的数据元素组成的集合,以及一些处理这些数据元素的规则或方法。在计算机科学中,数据结构与算法往往被用来指导程序的设计、优化和分析。通过对数据进行合理的组织、分类和储存,并加以有效地访问和修改,数据结构与算法帮助计算机高效地解决问题,提升运行
  • 1
  • 2
  • 3
  • 4
  • 5