整体事件经过 设备紫屏,ESXi已自动关机脱离集群

看uuid是3.84T的容量层SSD

根据紫屏上的报错,对应kb https://kb.vmware.com/s/article/71207

收集日志,这个主机发生紫屏, 是因为有一个vsan 磁盘suspend 住了IO,IO 无法下发, 然后在超过120秒后VSAN 主动crash 了这个主机,

t10.NVMe____VO003840KWVMU___________________________FF05B091F8382500 ,正好是引发紫屏的磁盘丢失。

处理方法: 可以用命令行删除磁盘。

vdq -iH 确认主机上磁盘组的情况

esxcli vsan storage list <=== 列出磁盘的详细信息。

esxcli vsan storage remove -d device_id 删除磁盘。

esxcli vsan storage remove -d t10.NVMe____VO003840KWVMU___________________________FF05B091F8382500

删除磁盘之后, 更换物理盘之后就可以在管理界面中给磁盘组加磁盘。开机,将VM迁移至改主机,验证网络、应用服务有效性。