为什么要学习内存管理?

Java与C++之间有一堵由内存动态分配和垃圾回收机制所围成的高墙,墙外面的人想进去,墙里面的人出不来

对于Java程序员来说,JVM给我们提供了自动内存管理机制,不需要既当“皇帝”,又当“人民”,不需要人为地给每一个new操作写配对的delete/free代码,不容易出现内存泄漏和内存溢出问题。然而一旦出现内存泄漏和溢出方面的问题,如果不清楚JVM内存的内存管理机制,那么将很难定位与解决问题。而且,JVM的内存管理机制在面试中也是非常重要的考点之一。

JVM 执行 Java 程序的过程:Java 源代码文件 (.java) 会被 Java 编译器编译为字节码文件(.class),然后由 JVM 中的类加载器加载各个类的字节码文件,加载完毕之后,交由 JVM 执行引擎执行

java的内存管理与C++的不同 java的内存管理机制_Java

执行Java程序的过程

在上述过程中,JVM会用一段空间来存储执行程序期间需要用到的数据和相关信息,这段空间就是运行时数据区,也就是常说的JVM内存
JVM会将它所管理的内存划分为若干个不同的数据区域,划分结果如图:

java的内存管理与C++的不同 java的内存管理机制_Java_02

 可见,运行时数据区被分为线程私有数据区和线程共享数据区两大类:
线程私有数据区包含:程序计数器、虚拟机栈、本地方法栈
线程共享数据区包含:Java堆、方法区(内部包含运行时常量池)
下面将为您详细介绍各个数据区的内容

2.1.1 程序计数器
定义:当前线程所执行的字节码的行号指示器
如果线程正在执行的是一个 Java 方法,那么计数器记录的是正在执行的虚拟机字节码指令的地址
如果线程正在执行的是一个 Native 方法,那么计数器的值则为空
字节码解释器工作时,就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
为什么必须是私有:为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,因此它是线程私有的内存

2.1.2 Java 虚拟机栈
想更加详细了解 JVM 栈的读者,可以看下笔者写的这篇文章:运行时栈帧结构
定义: Java 方法执行的内存模型
每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等方法信息
每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程
局部变量表存放了编译期可知的各种基本数据类型、对象引用类型和 returnAddress 类型,它所需的内存空间在编译期间完成分配
线程私有的内存,与线程生命周期相同
一般把 Java 内存区分为堆内存(Heap)和栈内存(Stack),其中『栈』指的是虚拟机栈,『堆』指的是 Java 堆
在 Java 虚拟机规范中,对这个区域规定了两种异常状况:
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出 StackOverflowError 异常
如果虚拟机栈可动态扩展且扩展时无法申请到足够的内存,将抛出 OutOfMemoryError 异常

2.1.3 本地方法栈
定义:虚拟机使用到的 Native 方法服务
想要了解Native方法的读者,可以看下这篇文章:Java中native方法
在虚拟机规范中,对这个区域无强制规定,由具体的虚拟机自由实现。与虚拟机栈一样,本地方法栈区域也会抛出 StackOverflowError 和 OutOfMemoryError 异常

2.1.4 Java堆
定义:被所有线程共享的一块内存区域,在虚拟机启动时创建
作用:用于存放几乎所有的对象实例和数组
在 Java 堆中,可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB),但无论哪个区域,存储的都仍然是对象实例,进一步划分的目的是为了更好地回收内存,或者更快地分配内存
是垃圾收集器管理的主要区域,也被称做 “ GC 堆”(可别叫做垃圾堆orz)
是 JVM 所管理的内存中最大的一块
可处于物理上不连续的内存空间中,只要逻辑上是连续的即可
在 Java 虚拟机规范中,如果在堆中没有内存完成实例分配,且堆也无法再扩展时,将会抛出 OutOfMemoryError 异常

2.1.5 方法区

注意:方法区必须和虚拟机栈区分开,方法区不存方法,虚拟机栈存 Java 方法

定义:与 Java 堆一样,是各个线程共享的内存区域

作用:用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据

java的内存管理与C++的不同 java的内存管理机制_Java_03

 

2.1.7 直接内存
它并不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域,但是这部分内存也被频繁地调用
作用:避免了在JAVA堆和Native堆中来回复制数据,因此在一些场景下能显著提高性能
JDK1.4中新加入了NIO类,引入了基于通道与缓冲区的IO方式,可以使用Native函数库直接分配直接内存(堆外内存),然后通过DirectByteBuffer作为这块内存的引用进行操作

2.2 HotSpot 虚拟机内存对象探秘
在熟悉虚拟机内存划分及其具体内容之后,为详细了解虚拟机内存中数据的其他细节,以常用的虚拟机 HotSpot 和常用的内存区域 Java 堆为例,探讨 HotSpot 虚拟机在 Java 堆中对象分配、布局和访问的全过程

2.2.1 对象的创建
遇到一个 new 指令后创建过程分三步

1.类加载检查
检查 new 指令的参数是否能在常量池中定位到一个类的符号引用且该符号引用代表的类是否已被加载、解析和初始化,若没有则需先执行相应的类加载,反之下一步
想详细了解类加载的知识的话,可以看下笔者的一篇文章:一夜搞懂 | JVM 类加载机制

2.分配内存
由 Java 堆中的内存是否规整决定如何给新生对象分配可用空间
由堆所采用的垃圾收集器是否带有空间压缩整理的能力决定Java 堆中的内存是否规整
PS:想详细了解GC或者内存分配的话,可以看下笔者的这篇文章:一夜搞懂 | JVM GC&内存分配

若规整,采用 “指针碰撞” 分配方式:

过程:将用过和空闲的内存放在两边,中间以一个指针作为分界指示器。当分配内存时,就把指针向空闲一边挪动与对象大小相等的距离即可

应用:Serial、ParNew 等带 压缩过程的收集器

若非规整,采用 “空闲列表” 分配方式:

过程:维护一个记录可用内存块的列表。当分配内存时,就从列表中找到一块足够大的空间划分给对象实例并更新记录

应用:基于 Mark-Sweep 算法的 CMS 收集器

java的内存管理与C++的不同 java的内存管理机制_Java_04

  人们更愿意把这个区域称为 “永久代”,它还有个别名叫做 Non-Heap(非堆)
在 JDK7 的 HotSpot 中,已经把原本放在永久代的字符串常量池,静态变量移出;
在JDK8中,废弃永久代的概念,改用元空间;
对用元空间替换永久代的原因感兴趣的话,可以看下这篇文章:一文读懂 - 元空间和永久代
永久代/元空间 和方法区的区别:
永久代/元空间 可看作是方法区的实现
和 Java 堆一样不需要连续的内存和可以选择固定大小或可扩展外,还可选择不实现 GC
在 Java 虚拟机规范中,当方法区无法满足内存分配需求时,将抛出 OutOfMemoryError 异常