JVM内存不足导致进程死掉. Native memory allocation (mmap) failed to map

一台服务器上部署很多JAVA进程已经是微服务的常态,但也有些坑。

 

 

背景,测试服务器上的一些JAVA进程突然挂掉,查看call back的日志发现如下:

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 1786867712 bytes for committing reserved memory.
# Possible reasons:
# The system is out of physical RAM or swap space
# In 32 bit mode, the process size limit was hit
# Possible solutions:
# Reduce memory load on the system
# Increase physical memory or swap space
# Check if swap backing store is full
# Use 64 bit Java on a 64 bit OS
# Decrease Java heap size (-Xmx/-Xms)
# Decrease number of Java threads
# Decrease Java thread stack sizes (-Xss)
# Set larger code cache with -XX:ReservedCodeCacheSize=
# This output file may be truncated or incomplete.
#
# Out of Memory Error (os_linux.cpp:2673), pid=28610, tid=139813184919296
#
# JRE version: Java(TM) SE Runtime Environment (8.0_40-b26) (build 1.8.0_40-b26)
# Java VM: Java HotSpot(TM) 64-Bit Server VM (25.40-b25 mixed mode linux-amd64 compressed oops)
 
#

  

很明显是由于服务器的内存不足造成

 

内存不够用分两种情况

 

 推测:内存不够用分两种情况

 

推测 1, JAVA程序使用的内存申请超出了JVM分配的, 此类只会抛出 

java.lang.OutOfMemoryError: Java heap space,JAVA进程是不会有影响,下次也可以继续接受请求提供服务

 

 

推测 2, JVM尝试去像操作系统申请一块内存超出系统的可使用(RSS)内存时, 此时linux会结束JAVA进程,并抛出如上错误。

这种场景也常见: 如在一台16G内存的服务器上跑着两个服务,两个服务同时启动各自分配10G内存,因为JVM的垃圾回收机制一般情况下是不会有问题,能正常服务,当两个服务同时需要用到的内存超出16G时,将会被linux干掉一个服务.

(注: JVM启动时,通过-Xmx等参数分配的内存只会影响到VIRT ,详见上一篇博客《JAVA进程和linux内存间的大小关系

 

 

 

证实:

去证实是最重要的, 上面的都是我的推测

一台内存是1G的linux服务器



total used free shared buffers cached Mem: 984 119 864 0 2 20 -/+ buffers/cache: 97 886 Swap: 2044 45 1999



物理内存+swap内存 在 3G左右  (886+1999)

 

加入JAVA程序,因为是要观察JAVA的内存超出是否会终止JAVA的进程,故思路如下设计

1,用一个线程去申请分配内存

2,主线程不停报告存活状态

 程序如下

storm 进程 挂了 进程挂掉的原因_java


package org.hejinbin.memory.test;

import java.io.IOException;

/**
 * 用于演示内存不足导致JAVA进程退出, 注意:输入的size勿导致超出int (1024 * 1024 * size)
 * 
 * @author 何锦彬 QQ 277803242(包子) 2016.12.29
 */
public class Test {
    public static void main(String[] args) throws IOException, InterruptedException {

        new Thread(new Runnable() {

            public void run() {

                try {
                    //接收测试内存的大小,单位m
                    byte[] byteSize = new byte[50];
                    System.out.print("input want to allocation memory:");
                    int temp = System.in.read(byteSize);
                    String sizeStr = new String(byteSize, 0, temp);
                    int size = Integer.parseInt(sizeStr.trim());
                    System.out.println(1024 * 1024 * size);
                    byte[] bt = new byte[1024 * 1024 * size];
                    System.out.println("succ..allocation: " + size + "m");
                    //阻30分,防止垃圾回收
                    Thread.sleep(1000 * 60 * 30);
                } catch (Exception e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }

            }
        }).start();

        while (true) {
            //1分钟后报告
            Thread.sleep(1000 * 60);
            System.out.println(Thread.currentThread().getId() + ": i'm alive");
        }
    }
}



storm 进程 挂了 进程挂掉的原因_java

 

证实推测1:

运行程序,输入1000 (这里只要超过了年龄代内存其实就会抛出异常)

storm 进程 挂了 进程挂掉的原因_python_03

 

输出 alive, 证明了推测1,使用内存超出了并不会导致JAVA进程死掉

 

 

证实推测2:

打开窗口1 , 运行,输入

root@ubuntu:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test 
input want to allocation memory:

 

打开窗口2 , 运行,输入

root@ubuntu:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test 
input want to allocation memory:

 

然后在窗口1输入1500

运行如下:

input want to allocation memory:1500 
 succ..allocation: 1500m

然后在窗口2,输入1500

input want to allocation memory:1500 
 succ..allocation: 1500m

 

此时发现窗口1的JAVA进程被杀掉了,完整如下

 

root@ubuntu:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test 
 input want to allocation memory:1500 
 succ..allocation: 1500m 
 Killed

 

证实了推测2

结论: 如今微服务流行(趁点热度)。很多进程同时在一台服务器上跑, 必须注意,分配给JAVA的内存只和一定在服务器的可用内存之内。不然很有可能突然被linux干掉一个进程

 

最后还有个以为,为啥我的进程被killed之后,并没有产生hs_err_pid*.log的日志呢? 

分类: JVM,JDK source analyse