文章目录

  • 1. 问题记录
  • 1.1. 环境说明
  • 1.2. 问题表现
  • 2. 问题处理
  • 2.1. 解决思路
  • 2.2. 处理流程
  • 2.2.1. 针对思路1的处理流程
  • 2.2.2. 针对思路2的处理流程



1. 问题记录

1.1. 环境说明

  • vSAN 超融合环境(系统安装在 USB 设备上)
  • VCSA 版本:7.0U3a
  • ESXi 版本:7.0U2a

1.2. 问题表现

esxi存储文件删除怎么恢复 esxi7.0没有存储_Web


2. 问题处理

2.1. 解决思路

  • 解决思路1:既然告警没有配置 coredump 核心转储,那我们配置下不就完事了。不过,我不太想将 coredump 文件放在业务数据存储中,所以我打算通过 iSCSI 挂载 LUN 配置成 VMFS 共享存储,专门用来存储 coredump 文件。
  • 解决思路2:如果我本身就不 Care 这个告警,那我就可以设置参数不让它发出告警,这样也就眼不见心不烦了。不过在我看来这就和鸵鸟算法一样,只是忽略却并没有实际解决问题。

2.2. 处理流程

2.2.1. 针对思路1的处理流程

首先,我们需要 ssh 登录到其中一台告警的 ESXi 主机上查看当前 coredump 的配置信息;理论上,由于告警已经明确说明了当前未做任何有关 coredump 的配置,所以我们查询出来的结果应该为空。

[root@esxi1:~] esxcli system coredump file list   //返回结果为空。

接下来,我们通过指定 iscsiDS-esxi-coredump 存储(事先创建好的 VMFS 共享存储)来存放主机的 coredump 文件。

### 先创建 ###
[root@esxi1:~] esxcli system coredump file add -d iscsiDS-esxi-coredump -f esxi1

### 再查询 ###
[root@esxi1:~] esxcli system coredump file list
Path                                                                      Active  Configured        Size
------------------------------------------------------------------------  ------  ----------  ----------
/vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile   false       false  3128950784

此时,通过上面的查询结果我们不难发现,虽然 coredump 文件已经有了,但是并未被激活(Active 的状态值为 false);所以下一步我们需要激活 coredump 文件。

[root@esxi1:~] esxcli system coredump file set -p /vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile

最后,我们再次查看当前 coredump 的配置信息,发现都配置好了;刷新 vSphere Web Client 页面,就会看到主机上有关 coredump 的告警被消除了。

[root@esxi1:~] esxcli system coredump file list
Path                                                                      Active  Configured        Size
------------------------------------------------------------------------  ------  ----------  ----------
/vmfs/volumes/6278cd41-79592673-c436-002590fce43a/vmkdump/esxi1.dumpfile    true        true  3128950784

esxi存储文件删除怎么恢复 esxi7.0没有存储_共享存储_02

2.2.2. 针对思路2的处理流程

首先,我们登录 vSphere Web Client 打开主机的高级系统设置,通过设定 UserVars.SuppressCoredumpWarning 项,使其不对外触发告警。

esxi存储文件删除怎么恢复 esxi7.0没有存储_配置信息_03


esxi存储文件删除怎么恢复 esxi7.0没有存储_共享存储_04


esxi存储文件删除怎么恢复 esxi7.0没有存储_运维_05

此时,我们刷新一下页面,同样会发现主机上有关 coredump 的告警被消除了。

esxi存储文件删除怎么恢复 esxi7.0没有存储_共享存储_06

但是,通过查询结果可以很直观的看到,思路2就是规避了告警,实际上该主机依然没有启用 coredump 配置;因此,还是按照思路1的方式来处理更为稳妥。

esxi存储文件删除怎么恢复 esxi7.0没有存储_配置信息_07