前言

       尽管有很多新秀的语言陆续登场,Java依然占据一席之地,不管什么语言其思想都是万变不离其宗的。本文所含题目重视基础,偏重后端,若有不明之处,可自行搜索解析。后附一份阿里的Java面试大题。用人单位组织的面试有简单的,也有高质量的面试,通常高质量的面试重视该岗位开发基础,同时也会注重如软件工程理论知识,计算机网络,数据库,操作系统,数据结构等各类学科的通识知识。

一、Java相关

1.Arraylist与LinkedList默认空间是多少;

2.Arraylist与LinkedList区别与各自的优势List 和 Map 区别;

3.谈谈HashMap,哈希表解决hash冲突的方法;

4.为什么要重写hashcode()和equals()以及他们之间的区别与关系;

5.Object的hashcode()是怎么计算的?若hashcode方法永远返回1或者一个常量会产生什么结果?

6.Java Collections和Arrays的sort方法默认的排序方法是什么;

7.引用计数法与GC Root可达性分析法区别;

8.浅拷贝和深拷贝的区别;

9.String s="abc"和String s=new String("abc")区别;

10.HashSet方法里面的hashcode存在哪,如果重写equals不重写hashcode会怎么样?

11.反射的作用与实现原理;

12.Java中的回调机制;

13.模板方法模式;

14.开闭原则说一下;

15.发布/订阅使用场景;

16.KMP算法(一种改进的字符串匹配算法);

17.JMM里边的原子性、可见性、有序性是如何体现出来的,JMM中内存屏障是什么意思?

二、多线程

1.AtomicInteger底层实现原理;

2.synchronized与ReentraLock哪个是公平锁;

3.CAS机制会出现什么问题;

4.用过并发包下边的哪些类;

5..一个线程连着调用start两次会出现什么情况?

6.wait方法能不能被重写,wait能不能被中断;

7.线程池的实现?四种线程池?重要参数及原理?任务拒接策略有哪几种?线程状态以及API怎么操作会发生这种转换;常用的避免死锁方法;

 

三、JVM

1.Minor GC与Full GC分别在什么时候发生?.什么时候触发Full GC;

2.GC收集器有哪些?CMS收集器与G1收集器的特点。

3.Java在什么时候会出现内存泄漏;

4.Java中的大对象如何进行存储;

5.rt.jar被什么类加载器加载,什么时间加载;

6.自己写的类被什么加载,什么时间加载;

7.自己写的两个不同的类是被同一个类加载器加载的吗?为什么?

8.为什么新生代内存需要有两个Survivor区?

9.几种常用的内存调试工具:jmap、jstack、jconsole;

10.类加载的五个过程:加载、验证、准备、解析、初始化;

11.G1停顿吗,CMS回收步骤,CMS为什么会停顿,停顿时间;

12.栈主要存的数据是什么,堆呢?

13.堆分为哪几块,比如说新生代老生代,那么新生代又分为什么?

14.软引用和弱引用的使用场景(软引用可以实现缓存,弱引用可以用来在回调函数中防止内存泄露);

四、数据库

1.数据库索引,什么是全文索引,全文索引中的倒排索引是什么原理;

2.数据库最佳左前缀原则是什么?数据库的三大范式;

3.悲观锁和乐观锁的原理和应用场景;

4.左连接、右连接、内连接、外连接、交叉连接、笛卡儿积等;

5.一般情况下数据库宕机了如何进行恢复(什么是Write Ahead Log机制,什么是Double Write机制,什么是Check Point);

6.什么是redo日志、什么是undo日志;

7.数据库中的隔离性是怎样实现的;

8.原子性、一致性、持久性又是如何实现的;

9.什么是组合索引,组合索引什么时候会失效;

10.关系型数据库和非关系型数据库区别;

11.数据库死锁如何解决;

12.MySQL并发情况下怎么解决(通过事务、隔离级别、锁);

13.MySQL中的MVCC机制是什么意思,根据具体场景,MVCC是否有问题;

14.MySQL数据库的隔离级别,以及如何解决幻读;

五、缓存服务器

1.Redis中zSet跳跃表问题;

2.Redis的set的应用场合?Redis高级特性了解吗?Redis的pipeline有什么用处?Redis集群宕机如何处理,怎么样进行数据的迁移;

3.Redis的集群方案;

4.Redis原子操作怎么用比较好;

5.Redis过期策略是怎么实现的呢?

六、SSM相关

1.Spring中@Autowired和@Resource注解的区别?

2.Spring声明一个 bean 如何对其进行个性化定制;

3.MyBatis有什么优势;

4.MyBatis如何做事务管理;

七、操作系统

1.Linux静态链接和动态链接;

2.什么是IO多路复用模型(select、poll、epoll);

3.Linux中的grep管道用处?Linux的常用命令?操作系统中虚拟地址、逻辑地址、线性地址、物理地址的概念及区别;

4.内存的页面置换算法;

5.内存的页面置换算法;

6.进程调度算法,操作系统是如何调度进程的;

7.父子进程、孤儿进程、僵死进程等概念;

8.fork进程时的操作;kill用法,某个进程杀不掉的原因(僵死进程;进入内核态,忽略kill信号);

9.系统管理命令(如查看内存使用、网络情况);

10.find命令、awk使用;

11.Linux下排查某个死循环的线程;

八、网络相关

1.数据链路层是做什么的?

2.数据链路层的流量控制?

3.网络模型的分层、IP和Mac地址在那个层、TCP和HTTP分别在那个层;

4.TCP滑动窗口;

5.TCP为什么可靠;

6.TCP的同传,拆包与组装包是什么意思;

7.Https和Http有什么区别;Http 为什么是无状态的;

8.TCP三次握手,为什么不是三次,为什么不是四次;

9.TCP的拥塞控制、流量控制详细说明?Http1.0和Http2.0的区别;

10.两个不同ip地址的计算机之间如何通信;

11.地址解析协议ARP;

12.OSI七层模型分别对应着五层模型的哪一部分;

13.TCP三次握手数据丢失了怎么办?那如果后面又找到了呢?

九、分布式相关

1.消息队列使用的场景介绍和作用(应用耦合、异步消息、流量削锋等);

2.如何解决消息队列丢失消息和重复消费问题;

3.Kafka使用过吗,什么是幂等性?怎么保证一致性,持久化怎么做,分区partition的理解,LEO是什么意思,如何保证多个partition之间数据一致性的(ISR机制),为什么Kafka可以这么快(基于磁盘的顺序读写);

4.异步队列怎么实现;

5.你项目的并发是多少?

6.怎么解决高并发问题?

7.单机情况下Tomcat的并发大概是多少,MySQL的并发大致是多少?

8.什么是C10K问题;

9.高并发情况下怎么办;

10.分布式理论,什么是CAP理论,什么是Base理论,什么是Paxos理论;

11.分布式协议的选举算法;

12.说一下你对微服务的理解,与SOA的区别;

13.Dubbo的基本原理,RPC,支持哪些通信方式,服务的调用过程;

14.Dubbo如果有一个服务挂掉了怎么办;

15.分布式事务,操作两个表不在一个库,如何保证一致性。分布式系统中,每台机器如何产生一个唯一的随机值;系统的量级、pv、uv等;

16.什么是Hash一致性算法?分布式缓存的一致性,服务器如何扩容(哈希环);

17.正向代理、反向代理;

18.什么是客户端负载均衡策略、什么是服务器端负载均衡策略;

19.如何优化Tomcat,常见的优化方式有哪些;

20.Nginx的Master和Worker,Nginx是如何处理请求的;

十、系统设计相关

1.如何防止表单重复提交(Token令牌环等方式);

2.有一个url白名单,需要使用正则表达式进行过滤,但是url量级很大,大概亿级,那么如何优化正则表达式?如何优化亿级的url匹配呢?常见的Nginx负载均衡策略;

3.已有两台Nginx服务器了,倘若这时候再增加一台服务器,采用什么负载均衡算法比较好?

4.扫描二维码登录的过程解析;

5.如何设计一个生成唯一UUID的算法?实现一个负载均衡的算法,服务器资源分配为70%、20%、10%;

6.有三个线程T1 T2 T3,如何保证他们按顺序执行;

7.三个线程循环输出ABCABCABC....

十一、安全相关

什么是XSS攻击,XSS攻击的一般表现形式有哪些?如何防止XSS攻击;

********************************************************************************************************************

附:

:阿里技术一面(基础掌握牢固)

  • 常用的异常类型?
  • session
  • java锁
  • gc原理
  • hashmap
  • listlink arraylist 区别
  • aop 原理
  • 多线程
  • kafka 原理和容错
  • spark hadoop 原理
  • redis 同步机制
  • classLoader 机制
  • Http 协议
  • cookie的限制
  • 如何设计一个分步式登录系统?
  • Spring加载过程?
  • 自己有没有写过类似Spring这样的AOP事务?
  • spring的加载过程?
  • atomic 与 volatile的区别?
  • Thread的 notify()给notifyAll()的区别?
  • notifiy()是唤醒的那一个线程?
  • Thread.sleep()唤醒以后是否需要重新竞争?
  • 单例有多少种写法? 有什么区别? 你常用哪一种单例,为什么用这种?
  • 问一个Thread.join()相关的问题?
  • 写一个JAVA死锁的列子?
  • 如何解决死锁?
  • GC回收算法,及实现原理?
  • HashMap数据存储结构? key重复了怎么办? 是如何解决的?
  • Spring AOP的实现原理,底层用什么实现的?

阿里技术二面(技术原理、个人擅长的项目)

重点是面试技术原理,以及对技术的热情和专研程度:

  • Java的高级知识
  • 开源框架的原理
  • JVM
  • 多线程
  • 高并发
  • 中间件
  • 之前项目经历,运用的技术,遇到的问题,如何解决,个人有什么收获和成长;
  • 对于技术的热情(平时是否看些技术书籍,逛论坛,写博客,写源代码或程序等);

JAVA开发技术面试可能问到的问题?

  • 我们主要考核的是网络nio 分布式数据库高并发大数据
  • 自定义表格的实现?
  • 动态表单设计?
  • in-jvm(必考)以及jmm缓存模型如何调优?
  • 常用的RPC框架
  • nio和io
  • 并发编程,设计模式
  • 地图组件?
  • hashmap有什么漏洞会导致他变慢?
  • 如何给hashmap的key对象设计他的hashcode?
  • 泛型通配符?在什么情况下使用?
  • 后端方面:redis?分布式框架dubbo(阿里巴巴开源框架)?设计模式?
  • 场景式的问题:秒杀,能列出常见的排队、验证码、库存扣减方式对系统高并发的影响?
  • 能根据实际的需要构建缓存结构提高提高网站的访问速度,熟练使用ehcache、oscache,了解memcache。
  • 了解基于dns轮询的负载均衡,熟练配置web服务器实现负载均衡,程序级能综合使用基于hash或取模等手段实现软负载。
  • 熟悉分布式数据库设计和优化技术,熟练使用mysql、oracle、SqlServer等主流数据库,熟悉hadoop hbase mangodb redis ehcache、oscache memcache。对于大数据量的数据库处理采用分表分库、数据库读写分离、建立缓存等手段优化性能。
  • 熟练掌握lucene,能基于lucene开发大型的搜索引擎,并能用lucene来改善和优化数据库的like查询。

项目部分

  • 缓存的使用,如果现在需要实现一个简单的缓存,供搜索框中的ajax异步请求调用,使用什么结构?
  • 内存中的缓存不能一直存在,用什么算法定期将搜索权重较低的entry去掉?
  • TCP如何保证安全性
  • 红黑树的问题,B+数
  • JDK1.8中对HashMap的增强,如果一个桶上的节点数量过多,链表+数组的结构就会转换为红黑树。
  • 项目中使用的单机服务器,如果将它部署成分布式服务器?
  • MySQL的常见优化方式、定为慢查询
  • 手写一个线程安全的单例模式

进阿里必会知识:

  • 算法和数据结构数组、链表、二叉树、队列、栈的各种操作(性能,场景)
  • 二分查找和各种变种的二分查找
  • 各类排序算法以及复杂度分析(快排、归并、堆)
  • 各类算法题(手写)
  • 理解并可以分析时间和空间复杂度。
  • 动态规划(笔试回回有。。)、贪心。
  • 红黑树、AVL树、Hash树、Tire树、B树、B+树。
  • 图算法(比较少,也就两个最短路径算法理解吧)
  • 计算机网络OSI7层模型(TCP4层)每层的协议
  • get/post 以及幂等性
  • http 协议头相关
  • 网络攻击(CSRF、XSS)
  • TCP/IP三次握手、四次挥手
  • TCP与UDP比较
  • DDos攻击
  • (B)IO/NIO/AIO三者原理,各个语言是怎么实现的
  • Netty
  • Linux内核select poll epoll
  • 数据库(最多的还是mysql,Nosql有redis)索引(包括分类及优化方式,失效条件,底层结构)
  • sql语法(join,union,子查询,having,group by)
  • 引擎对比(InnoDB,MyISAM)
  • 数据库的锁(行锁,表锁,页级锁,意向锁,读锁,写锁,悲观锁,乐观锁,以及加锁的select sql方式)
  • 隔离级别,依次解决的问题(脏读、不可重复读、幻读)
  • 事务的ACID
  • B树、B+树
  • 优化(explain,慢查询,show profile)
  • 数据库的范式
  • 分库分表,主从复制,读写分离。
  • Nosql相关(redis和memcached区别之类的,如果你熟悉redis,redis还有一堆要问的)
  • 操作系统:进程通信IPC(几种方式),与线程区别
  • OS的几种策略(页面置换,进程调度等,每个里面有几种算法)
  • 互斥与死锁相关的
  • linux常用命令(问的时候都会给具体某一个场景)
  • Linux内核相关(select、poll、epoll)
  • 编程语言(这里只说Java):把我之后的面经过一遍,Java感觉覆盖的就差不多了,不过下面还是分个类。
  • Java基础(面向对象、四个特性、重载重写、static和final等等很多东西)
  • 集合(HashMap、ConcurrentHashMap、各种List,最好结合源码看)
  • 并发和多线程(线程池、SYNC和Lock锁机制、线程通信、volatile、ThreadLocal、CyclicBarrier、Atom包、CountDownLatch、AQS、CAS原理等等)
  • JVM(内存模型、GC垃圾回收,包括分代,GC算法,收集器、类加载和双亲委派、JVM调优,内存泄漏和内存溢出)
  • IO/NIO相关
  • 反射和代理、异常、Java8相关、序列化
  • 设计模式(常用的,jdk中有的)
  • Web相关(servlet、cookie/session、Spring)

阿里面试题目范畴:

  • 内存模型
  • 类加载机制
  • GC
  • JVM调优
  • 线程池原理
  • 动态代理
  • 悲观锁乐观锁
  • 高并发问题
  • 事务隔离级别
  • 索引原理
  • 限流
  • 分库分表
  • 分布式事务提交
  • 微服务
  • dubbo原理