文章目录
- 1. 问题记录
- 1.1. 环境说明
- 1.2. 问题表现
- 2. 问题处理
- 2.1. 解决思路
- 2.2. 处理流程
- 2.2.1. 针对思路1的处理流程
- 2.2.2. 针对思路2的处理流程
1. 问题记录
1.1. 环境说明
- vSAN 超融合环境(系统安装在 USB 设备上)
- VCSA 版本:7.0U3a
- ESXi 版本:7.0U2a
1.2. 问题表现

2. 问题处理
2.1. 解决思路
- 解决思路1:既然告警没有配置 coredump 核心转储,那我们配置下不就完事了。不过,我不太想将 coredump 文件放在业务数据存储中,所以我打算通过 iSCSI 挂载 LUN 配置成 VMFS 共享存储,专门用来存储 coredump 文件。
- 解决思路2:如果我本身就不 Care 这个告警,那我就可以设置参数不让它发出告警,这样也就眼不见心不烦了。不过在我看来这就和鸵鸟算法一样,只是忽略却并没有实际解决问题。
2.2. 处理流程
2.2.1. 针对思路1的处理流程
首先,我们需要 ssh 登录到其中一台告警的 ESXi 主机上查看当前 coredump 的配置信息;理论上,由于告警已经明确说明了当前未做任何有关 coredump 的配置,所以我们查询出来的结果应该为空。
[root@esxi1:~] esxcli system coredump file list //返回结果为空。接下来,我们通过指定 iscsiDS-esxi-coredump 存储(事先创建好的 VMFS 共享存储)来存放主机的 coredump 文件。
### 先创建 ###
[root@esxi1:~] esxcli system coredump file add -d iscsiDS-esxi-coredump -f esxi1
### 再查询 ###
[root@esxi1:~] esxcli system coredump file list
Path Active Configured Size
------------------------------------------------------------------------ ------ ---------- ----------
/vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile false false 3128950784此时,通过上面的查询结果我们不难发现,虽然 coredump 文件已经有了,但是并未被激活(Active 的状态值为 false);所以下一步我们需要激活 coredump 文件。
[root@esxi1:~] esxcli system coredump file set -p /vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile最后,我们再次查看当前 coredump 的配置信息,发现都配置好了;刷新 vSphere Web Client 页面,就会看到主机上有关 coredump 的告警被消除了。
[root@esxi1:~] esxcli system coredump file list
Path Active Configured Size
------------------------------------------------------------------------ ------ ---------- ----------
/vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile true true 3128950784
2.2.2. 针对思路2的处理流程
首先,我们登录 vSphere Web Client 打开主机的高级系统设置,通过设定 UserVars.SuppressCoredumpWarning 项,使其不对外触发告警。



此时,我们刷新一下页面,同样会发现主机上有关 coredump 的告警被消除了。

但是,通过查询结果可以很直观的看到,思路2就是规避了告警,实际上该主机依然没有启用 coredump 配置;因此,还是按照思路1的方式来处理更为稳妥。

















