前言
尽管有很多新秀的语言陆续登场,Java依然占据一席之地,不管什么语言其思想都是万变不离其宗的。本文所含题目重视基础,偏重后端,若有不明之处,可自行搜索解析。后附一份阿里的Java面试大题。用人单位组织的面试有简单的,也有高质量的面试,通常高质量的面试重视该岗位开发基础,同时也会注重如软件工程理论知识,计算机网络,数据库,操作系统,数据结构等各类学科的通识知识。
一、Java相关
1.Arraylist与LinkedList默认空间是多少;
2.Arraylist与LinkedList区别与各自的优势List 和 Map 区别;
3.谈谈HashMap,哈希表解决hash冲突的方法;
4.为什么要重写hashcode()和equals()以及他们之间的区别与关系;
5.Object的hashcode()是怎么计算的?若hashcode方法永远返回1或者一个常量会产生什么结果?
6.Java Collections和Arrays的sort方法默认的排序方法是什么;
7.引用计数法与GC Root可达性分析法区别;
8.浅拷贝和深拷贝的区别;
9.String s="abc"和String s=new String("abc")区别;
10.HashSet方法里面的hashcode存在哪,如果重写equals不重写hashcode会怎么样?
11.反射的作用与实现原理;
12.Java中的回调机制;
13.模板方法模式;
14.开闭原则说一下;
15.发布/订阅使用场景;
16.KMP算法(一种改进的字符串匹配算法);
17.JMM里边的原子性、可见性、有序性是如何体现出来的,JMM中内存屏障是什么意思?
二、多线程
1.AtomicInteger底层实现原理;
2.synchronized与ReentraLock哪个是公平锁;
3.CAS机制会出现什么问题;
4.用过并发包下边的哪些类;
5..一个线程连着调用start两次会出现什么情况?
6.wait方法能不能被重写,wait能不能被中断;
7.线程池的实现?四种线程池?重要参数及原理?任务拒接策略有哪几种?线程状态以及API怎么操作会发生这种转换;常用的避免死锁方法;
三、JVM
1.Minor GC与Full GC分别在什么时候发生?.什么时候触发Full GC;
2.GC收集器有哪些?CMS收集器与G1收集器的特点。
3.Java在什么时候会出现内存泄漏;
4.Java中的大对象如何进行存储;
5.rt.jar被什么类加载器加载,什么时间加载;
6.自己写的类被什么加载,什么时间加载;
7.自己写的两个不同的类是被同一个类加载器加载的吗?为什么?
8.为什么新生代内存需要有两个Survivor区?
9.几种常用的内存调试工具:jmap、jstack、jconsole;
10.类加载的五个过程:加载、验证、准备、解析、初始化;
11.G1停顿吗,CMS回收步骤,CMS为什么会停顿,停顿时间;
12.栈主要存的数据是什么,堆呢?
13.堆分为哪几块,比如说新生代老生代,那么新生代又分为什么?
14.软引用和弱引用的使用场景(软引用可以实现缓存,弱引用可以用来在回调函数中防止内存泄露);
四、数据库
1.数据库索引,什么是全文索引,全文索引中的倒排索引是什么原理;
2.数据库最佳左前缀原则是什么?数据库的三大范式;
3.悲观锁和乐观锁的原理和应用场景;
4.左连接、右连接、内连接、外连接、交叉连接、笛卡儿积等;
5.一般情况下数据库宕机了如何进行恢复(什么是Write Ahead Log机制,什么是Double Write机制,什么是Check Point);
6.什么是redo日志、什么是undo日志;
7.数据库中的隔离性是怎样实现的;
8.原子性、一致性、持久性又是如何实现的;
9.什么是组合索引,组合索引什么时候会失效;
10.关系型数据库和非关系型数据库区别;
11.数据库死锁如何解决;
12.MySQL并发情况下怎么解决(通过事务、隔离级别、锁);
13.MySQL中的MVCC机制是什么意思,根据具体场景,MVCC是否有问题;
14.MySQL数据库的隔离级别,以及如何解决幻读;
五、缓存服务器
1.Redis中zSet跳跃表问题;
2.Redis的set的应用场合?Redis高级特性了解吗?Redis的pipeline有什么用处?Redis集群宕机如何处理,怎么样进行数据的迁移;
3.Redis的集群方案;
4.Redis原子操作怎么用比较好;
5.Redis过期策略是怎么实现的呢?
六、SSM相关
1.Spring中@Autowired和@Resource注解的区别?
2.Spring声明一个 bean 如何对其进行个性化定制;
3.MyBatis有什么优势;
4.MyBatis如何做事务管理;
七、操作系统
1.Linux静态链接和动态链接;
2.什么是IO多路复用模型(select、poll、epoll);
3.Linux中的grep管道用处?Linux的常用命令?操作系统中虚拟地址、逻辑地址、线性地址、物理地址的概念及区别;
4.内存的页面置换算法;
5.内存的页面置换算法;
6.进程调度算法,操作系统是如何调度进程的;
7.父子进程、孤儿进程、僵死进程等概念;
8.fork进程时的操作;kill用法,某个进程杀不掉的原因(僵死进程;进入内核态,忽略kill信号);
9.系统管理命令(如查看内存使用、网络情况);
10.find命令、awk使用;
11.Linux下排查某个死循环的线程;
八、网络相关
1.数据链路层是做什么的?
2.数据链路层的流量控制?
3.网络模型的分层、IP和Mac地址在那个层、TCP和HTTP分别在那个层;
4.TCP滑动窗口;
5.TCP为什么可靠;
6.TCP的同传,拆包与组装包是什么意思;
7.Https和Http有什么区别;Http 为什么是无状态的;
8.TCP三次握手,为什么不是三次,为什么不是四次;
9.TCP的拥塞控制、流量控制详细说明?Http1.0和Http2.0的区别;
10.两个不同ip地址的计算机之间如何通信;
11.地址解析协议ARP;
12.OSI七层模型分别对应着五层模型的哪一部分;
13.TCP三次握手数据丢失了怎么办?那如果后面又找到了呢?
九、分布式相关
1.消息队列使用的场景介绍和作用(应用耦合、异步消息、流量削锋等);
2.如何解决消息队列丢失消息和重复消费问题;
3.Kafka使用过吗,什么是幂等性?怎么保证一致性,持久化怎么做,分区partition的理解,LEO是什么意思,如何保证多个partition之间数据一致性的(ISR机制),为什么Kafka可以这么快(基于磁盘的顺序读写);
4.异步队列怎么实现;
5.你项目的并发是多少?
6.怎么解决高并发问题?
7.单机情况下Tomcat的并发大概是多少,MySQL的并发大致是多少?
8.什么是C10K问题;
9.高并发情况下怎么办;
10.分布式理论,什么是CAP理论,什么是Base理论,什么是Paxos理论;
11.分布式协议的选举算法;
12.说一下你对微服务的理解,与SOA的区别;
13.Dubbo的基本原理,RPC,支持哪些通信方式,服务的调用过程;
14.Dubbo如果有一个服务挂掉了怎么办;
15.分布式事务,操作两个表不在一个库,如何保证一致性。分布式系统中,每台机器如何产生一个唯一的随机值;系统的量级、pv、uv等;
16.什么是Hash一致性算法?分布式缓存的一致性,服务器如何扩容(哈希环);
17.正向代理、反向代理;
18.什么是客户端负载均衡策略、什么是服务器端负载均衡策略;
19.如何优化Tomcat,常见的优化方式有哪些;
20.Nginx的Master和Worker,Nginx是如何处理请求的;
十、系统设计相关
1.如何防止表单重复提交(Token令牌环等方式);
2.有一个url白名单,需要使用正则表达式进行过滤,但是url量级很大,大概亿级,那么如何优化正则表达式?如何优化亿级的url匹配呢?常见的Nginx负载均衡策略;
3.已有两台Nginx服务器了,倘若这时候再增加一台服务器,采用什么负载均衡算法比较好?
4.扫描二维码登录的过程解析;
5.如何设计一个生成唯一UUID的算法?实现一个负载均衡的算法,服务器资源分配为70%、20%、10%;
6.有三个线程T1 T2 T3,如何保证他们按顺序执行;
7.三个线程循环输出ABCABCABC....
十一、安全相关
什么是XSS攻击,XSS攻击的一般表现形式有哪些?如何防止XSS攻击;
********************************************************************************************************************
附:
一:阿里技术一面(基础掌握牢固)
- 常用的异常类型?
- session
- java锁
- gc原理
- hashmap
- listlink arraylist 区别
- aop 原理
- 多线程
- kafka 原理和容错
- spark hadoop 原理
- redis 同步机制
- classLoader 机制
- Http 协议
- cookie的限制
- 如何设计一个分步式登录系统?
- Spring加载过程?
- 自己有没有写过类似Spring这样的AOP事务?
- spring的加载过程?
- atomic 与 volatile的区别?
- Thread的 notify()给notifyAll()的区别?
- notifiy()是唤醒的那一个线程?
- Thread.sleep()唤醒以后是否需要重新竞争?
- 单例有多少种写法? 有什么区别? 你常用哪一种单例,为什么用这种?
- 问一个Thread.join()相关的问题?
- 写一个JAVA死锁的列子?
- 如何解决死锁?
- GC回收算法,及实现原理?
- HashMap数据存储结构? key重复了怎么办? 是如何解决的?
- Spring AOP的实现原理,底层用什么实现的?
阿里技术二面(技术原理、个人擅长的项目)
重点是面试技术原理,以及对技术的热情和专研程度:
- Java的高级知识
- 开源框架的原理
- JVM
- 多线程
- 高并发
- 中间件
- 之前项目经历,运用的技术,遇到的问题,如何解决,个人有什么收获和成长;
- 对于技术的热情(平时是否看些技术书籍,逛论坛,写博客,写源代码或程序等);
JAVA开发技术面试可能问到的问题?
- 我们主要考核的是网络nio 分布式数据库高并发大数据
- 自定义表格的实现?
- 动态表单设计?
- in-jvm(必考)以及jmm缓存模型如何调优?
- 常用的RPC框架
- nio和io
- 并发编程,设计模式
- 地图组件?
- hashmap有什么漏洞会导致他变慢?
- 如何给hashmap的key对象设计他的hashcode?
- 泛型通配符?在什么情况下使用?
- 后端方面:redis?分布式框架dubbo(阿里巴巴开源框架)?设计模式?
- 场景式的问题:秒杀,能列出常见的排队、验证码、库存扣减方式对系统高并发的影响?
- 能根据实际的需要构建缓存结构提高提高网站的访问速度,熟练使用ehcache、oscache,了解memcache。
- 了解基于dns轮询的负载均衡,熟练配置web服务器实现负载均衡,程序级能综合使用基于hash或取模等手段实现软负载。
- 熟悉分布式数据库设计和优化技术,熟练使用mysql、oracle、SqlServer等主流数据库,熟悉hadoop hbase mangodb redis ehcache、oscache memcache。对于大数据量的数据库处理采用分表分库、数据库读写分离、建立缓存等手段优化性能。
- 熟练掌握lucene,能基于lucene开发大型的搜索引擎,并能用lucene来改善和优化数据库的like查询。
项目部分
- 缓存的使用,如果现在需要实现一个简单的缓存,供搜索框中的ajax异步请求调用,使用什么结构?
- 内存中的缓存不能一直存在,用什么算法定期将搜索权重较低的entry去掉?
- TCP如何保证安全性
- 红黑树的问题,B+数
- JDK1.8中对HashMap的增强,如果一个桶上的节点数量过多,链表+数组的结构就会转换为红黑树。
- 项目中使用的单机服务器,如果将它部署成分布式服务器?
- MySQL的常见优化方式、定为慢查询
- 手写一个线程安全的单例模式
进阿里必会知识:
- 算法和数据结构数组、链表、二叉树、队列、栈的各种操作(性能,场景)
- 二分查找和各种变种的二分查找
- 各类排序算法以及复杂度分析(快排、归并、堆)
- 各类算法题(手写)
- 理解并可以分析时间和空间复杂度。
- 动态规划(笔试回回有。。)、贪心。
- 红黑树、AVL树、Hash树、Tire树、B树、B+树。
- 图算法(比较少,也就两个最短路径算法理解吧)
- 计算机网络OSI7层模型(TCP4层)每层的协议
- get/post 以及幂等性
- http 协议头相关
- 网络攻击(CSRF、XSS)
- TCP/IP三次握手、四次挥手
- TCP与UDP比较
- DDos攻击
- (B)IO/NIO/AIO三者原理,各个语言是怎么实现的
- Netty
- Linux内核select poll epoll
- 数据库(最多的还是mysql,Nosql有redis)索引(包括分类及优化方式,失效条件,底层结构)
- sql语法(join,union,子查询,having,group by)
- 引擎对比(InnoDB,MyISAM)
- 数据库的锁(行锁,表锁,页级锁,意向锁,读锁,写锁,悲观锁,乐观锁,以及加锁的select sql方式)
- 隔离级别,依次解决的问题(脏读、不可重复读、幻读)
- 事务的ACID
- B树、B+树
- 优化(explain,慢查询,show profile)
- 数据库的范式
- 分库分表,主从复制,读写分离。
- Nosql相关(redis和memcached区别之类的,如果你熟悉redis,redis还有一堆要问的)
- 操作系统:进程通信IPC(几种方式),与线程区别
- OS的几种策略(页面置换,进程调度等,每个里面有几种算法)
- 互斥与死锁相关的
- linux常用命令(问的时候都会给具体某一个场景)
- Linux内核相关(select、poll、epoll)
- 编程语言(这里只说Java):把我之后的面经过一遍,Java感觉覆盖的就差不多了,不过下面还是分个类。
- Java基础(面向对象、四个特性、重载重写、static和final等等很多东西)
- 集合(HashMap、ConcurrentHashMap、各种List,最好结合源码看)
- 并发和多线程(线程池、SYNC和Lock锁机制、线程通信、volatile、ThreadLocal、CyclicBarrier、Atom包、CountDownLatch、AQS、CAS原理等等)
- JVM(内存模型、GC垃圾回收,包括分代,GC算法,收集器、类加载和双亲委派、JVM调优,内存泄漏和内存溢出)
- IO/NIO相关
- 反射和代理、异常、Java8相关、序列化
- 设计模式(常用的,jdk中有的)
- Web相关(servlet、cookie/session、Spring)
阿里面试题目范畴:
- 内存模型
- 类加载机制
- GC
- JVM调优
- 线程池原理
- 动态代理
- 悲观锁乐观锁
- 高并发问题
- 事务隔离级别
- 索引原理
- 限流
- 分库分表
- 分布式事务提交
- 微服务
- dubbo原理