1. 现象:

    当BE对改虚拟机执行备份任务后,几分钟后会出现如下报错:

BE备份VM导致死机_BE

java进程被阻塞.

Jul 20 11:23:42 CDCorpLnxVM01 kernel: pci 0000:00:15.3: BAR13: failed to assign [io  size 0x1000]

百度上说这种问题是由于IO性能下降引起内存往磁盘写入数据缓慢.按照网上所述,修改2个参数:

vm.dirty_background_ratio = 5
vm.dirty_ratio = 10

结果也不起作用.但报错有变化:

Jul 21 17:23:11 CDCorpLnxVM01 SYMBDSNAP_SDK[11518]: Driveris not loaded. Loading symbdsnap.

Jul 21 17:23:11 CDCorpLnxVM01 SYMBDSNAP_SDK[11518]: Missingsymbdsnap driver.

按照网上所述,在BE备份设置忽略AOFO-L,最终没发现这个参数.


2. 按照同事描述他曾经执行过yum install -y kernel-devel kernel-headers

由此想到应该是内核出了问题.

于是尝试查看启动内核版本,如下:

BE备份VM导致死机_BE_02

默认是第一个内核.

那我们尝试配置第二个内核为默认内核,如下:

配置默认内核:

cat /boot/grub2/grub.cfg | grep "men"

grub2-set-default “CentOS Linux (3.10.0-327.el7.x86_64) 7(Core)”

Grub2-editenv list验证是否成功