vSan数据恢复方案–闪存盘损坏后重建磁盘组导致数据丢失

提示:本文只提供一些数据恢复的思路和要点



文章目录

  • vSan数据恢复方案--闪存盘损坏后重建磁盘组导致数据丢失
  • 前言
  • 一、详细了解数据丢失的过程
  • 二、对应的数据恢复思路
  • 1.解析出与故障VMDK文件对应的虚拟对象
  • 2.依据获取的虚拟对象的ID,在vSphere监控里面查看该虚拟对象的结构
  • 3.依据获取的虚拟对象ID,从硬盘提取隶属于该ID的组件成员,重组RAID,获取丢失的数据
  • 总结



前言

随着数据存储量越来越大,一般的存储难以满足很多大公司的使用需求,故出现了各种虚拟化平台,这些平台为了更好的幸好和方便管理,都自研了一些独有的存储方式,其中最常见的就是分布式存储本文主要讲述了基于VMware vSphere所创建的vSan分布式存储架构


一、详细了解数据丢失的过程

知己知彼,方能百战百胜,数据恢复也是一样,详细了解数据丢失的过程,可以使数据恢复更加简单

与客户详细沟通得知故障原因如下:
整个VMware vSphere共控制多个集群,其中出现故障的集群使用的Vsan分布式结构存储,该Vsan由
10台华为2288H V5 存储构成,每一台存储由2块HDD(物理盘)和一块SSD(闪存盘)构成1个磁盘组,每台存储都有4个磁盘组。

故障原因是,10台存储内的一台存储中的1个磁盘组的闪存盘出现故障,磁盘指示灯报错,但是数据能够正常使用,于是更换一块新的SSD硬盘上去,但之前的磁盘组不认这个硬盘,故磁盘组失效,维护人员重新选择该磁盘组的2块HDD与新的SSD重新组成一个新的磁盘组,并重新加入vSan分布式存储集群,2小时后同步完成,集群能够正常访问,但涉及该磁盘组的虚拟机中,有一台虚拟机无法启动,检查后发现该虚拟机的VMDK文件变成1KB大小。

通过我方技术人员现场分析梳理,发现出现问题的虚拟机存储策略与其他正常虚拟机策略不一致,该虚拟机采用的是RAID0结构的策略,并且未使用置备,其他虚拟机均采用RAID1策略,使用100%置备。

通过我方技术工程师现场分析,重建该磁盘组的时候,其实涉及存储在该磁盘组的虚拟机已经全部出现故障,但是由于使用100%置备策略的原因,已经自动降级,然后自动恢复并且又继续使用100%置备策略,故这些虚拟机都能够自动恢复成正常的状态,但没有使用该策略的虚拟机则不能自动恢复,出现数据丢失。

esxi8搭建vsan声明磁盘_分布式

二、对应的数据恢复思路

1.解析出与故障VMDK文件对应的虚拟对象

如果有不清楚 vSan分布式存储集群 里面VMDK和虚拟对象关系的可以去查看我的上一篇文章,这里就不作过多的解释了

2.依据获取的虚拟对象的ID,在vSphere监控里面查看该虚拟对象的结构

有些极端情况下,该虚拟对象已经在vSphere监控里面丢失,无法找到该虚拟对象,则需要使用winhex手动的分析,可以使用winhex访问硬盘底层扇区,呈现结构如下(上一篇文章也有说明具体怎么查看)

esxi8搭建vsan声明磁盘_服务器_02


解析 vSan 分布式存储的分区在该HDD和SSD上占用的空间,在这些空间内可以通过16进制数编辑器winhex 分析出丢失的虚拟对象ID,也可以使用网上能够支持vSan分布式存储的数据恢复工具进行解析。

由于目前市面上能够支持vSan分布式存储的分析软件少之又少,小编整理了一些工具,放在文章末尾,免费放给大家分析使用,可以用winhex通过16进制数的数据,再配合这个工具,就能够提取指定虚拟对象或VMDK虚拟磁盘文件。

3.依据获取的虚拟对象ID,从硬盘提取隶属于该ID的组件成员,重组RAID,获取丢失的数据

通过VMware vSphere vSan数据恢复工具1.0.rar 我们手动输入虚拟对象ID,选择HDD和SSD,即可提取分布存储在该磁盘组中的组件数据,这样一步一步的就可以提取出整个虚拟对象的组件,然后重组RAID即可恢复出丢失的数据。

esxi8搭建vsan声明磁盘_esxi8搭建vsan声明磁盘_03