服务器数据恢复环境: 8块SAS硬盘中的7块硬盘组成RAID5阵列,1块作为热备盘。 服务器故障: 故障服务器存储中的RAID5阵列有2块硬盘损坏离线,RAID5阵列瘫痪,影响上层LUN无法正常使用。管理员联系我们数据恢复中心进行数据恢复,硬件工程师检测硬盘没有发现物理故障和坏道。
服务器数据恢复环境: HP EVA存储,6块SAS硬盘组建的raid5磁盘阵列。上层操作系统是WINDOWS SERVER。该存储为公司内部文件服务器使用。 服务器故障&分析: 在遭遇两次意外断电后,设备重启时raid提示“无法找到存储设备”。管理员尝试进入raid管理模块时死机,多次重启尝试后故障依旧。
服务器数据恢复环境: IBM X系列服务器+柏科某型号存储。服务器上部署VMware ESXi虚拟主机,存储上存放虚拟机文件。 虚拟主机采用的Windows Server操作系统,部署宏桥和索菲2套应用,数据库是SQL Server。 虚拟磁盘:数据盘(精简模式)+ 快照数据盘。 服务器故障: 机房异常断电导致服务器上某台虚拟机无法正常启动。管理员查看虚拟机配置文件,发现此虚拟机的配置文件除了磁盘文件外其他的配置文件全部丢失,xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。联系VMware原厂工程师,VMware工程师需要新建一个虚拟机来解决故障问题,但发现ESXi存储空间不足。于是管理员将故障虚拟机下的xxx-flat.vmdk磁盘文件删除,然后VMware工程师重建了一个虚拟机并且分配了固定大小的虚拟磁盘。
服务器数据恢复环境: 华为OceanStor某型号存储,10块硬盘组成raid6磁盘阵列。 上层操作系统采用EXT3文件系统,划分2个lun。 服务器故障&分析: 在巡检中发现存储中的raid不可用,管理员进行了重新分配并初始化raid的操作,当初始化进度到40%左右时,管理员才发现自己的操作有问题,于是强行中止初始化,但部分数据已经被破坏。 在发现raid不可用后,管理员将raid6中的9块数据盘重新分配为riad5阵列并进行了初始化操作,这些操作对原始数据造成不可逆的破坏。
服务器数据恢复环境: 某品牌存储,12块SAS硬盘组建RAID6磁盘阵列,划分一个卷,分配给几台Vmware ESXI主机做共享存储。 卷中存放了大量的Windows虚拟机,虚拟机通过模板创建的,系统盘大小一致,数据盘大小不确定,数据盘都是精简模式。 服务器故障: 机房意外断电,电力供应恢复正常后存储无法正常开机使用。经过用户方工程师诊断,初步判断是意外断电导致的存储设备中的磁盘阵列损坏。
服务器数据恢复环境: HP ProLiant DL某系列服务器,三块SAS硬盘组建raid阵列。 上层系统部署有数据库,数据库存放在D分区,备份存放在E分区。 服务器故障: 磁盘故障导致RAID瘫痪,其中一块硬盘状态灯显示红色。存放数据库文件的D分区无法识别;E分区可识别,但是拷贝备份文件报错。管理员重启服务器,离线硬盘上线进行数据同步。同步还没有完成时,管理员发现异常,将服务器强制关机,之后没有对服务器做任何操作。
服务器数据恢复环境: DroboPro FS网络存储,数块SAS硬盘组建的raid5磁盘阵列。 服务器故障: 存储中有一个共享文件夹由于未知原因丢失。
服务器数据恢复环境: IBM TotalStorage DS系列存储,包含一个存储机头和多个存储扩展柜,磁盘柜中的磁盘创建了多组RAID5。 其中6号扩展柜中的RAID5由15块成员盘和1块热备硬盘组成。 服务器故障: 6号扩展柜中的一块硬盘离线,热备盘替换上线并开始同步数据。在热备盘同步数据的过程中,又有一块磁盘出现故障离线,热备盘同步数据失败,RAID5磁盘阵列失效,卷无法挂载访问。
华为OceanStor T系列某型号统一存储,支持SAN和NAS存储协议。工作人员在巡检时发现存储设备上一个NAS卷中的数据丢失。该卷中的数据包括office文档、PDF文件、图片(JPG、JPEG、PNG等),视频文件(MP4、AVI等),音频文件(MP3等)。发现问题后管理员立即关闭系统应用,停止上传数据。
服务器数据恢复环境: 北京某公司的EMC NAS,总共有3个节点,每个节点配置12块STAT硬盘。 NAS中存放有vmware虚拟机(WEB 服务器)和视频文件。 虚拟机通过NFS协议共享到ESX主机,视频文件通过CIFS协议共享给虚拟机(WEB服务器)。 服务器故障: 由于工作人员误操作将包括MSSQL数据库,大量MP4、ASF和TS格式的视频文件删除。NFS共享的所有数据(虚拟机)被删除而CIFS共享的数据则没有被删除。
H3C FlexStorage某型号存储,25块磁盘组建的RAID5,其中包含一块热备盘。 工作人员误操作将存储设备中原先的2个卷删除,删除之后又使用和删除2个卷同样大小的空间重建了一个卷。用户希望恢复删除的2个卷中的一个。
数据库数据恢复环境: 一台Dell PowerEdge某型号存储,数块SAS硬盘分别组建raid1和raid5两组磁盘阵列。其中2块磁盘组建的RAID1,用于安装操作系统;其余几块磁盘组建raid5,用于存放数据。 上层安装的windows服务器,部署有sql server数据库,sql server数据库存放在C盘分区。 数据库故障&分析: 管理员发现存放sql server数据库的C盘剩余空间不足,于是将数据库路径指向D盘,在D盘生成了一个.ndf文件。 大约半个月之后,数据库出现故障,无法连接和附加查询。 由于数据库文件所在磁盘的容量不足,数据库无法正常运行,出现逻辑错误。
服务器数据恢复环境: 某公司一台服务器中组建一组raid5磁盘阵列; 上层操作系统为linux redhat,部署OA系统,后端数据库为oracle。 服务器故障&初检: raid5中有2块磁盘先后掉线,服务器崩溃。oracle已经不对该OA系统提供后续技术支持,用户方要求恢复数据和操作系统。 经过初步检测,发现热备盘没有启用,硬盘无明显的物理故障和同步表现。
服务器数据恢复环境: 一台HP DL系列服务器,通过hp smart array控制器挂载一台磁盘阵列设备,作为公司内部的文件服务器使用; 该磁盘阵列设备中有一组由十几块SCSI硬盘组建的RAID5; 上层安装LINUX操作系统并部署了NFS+FTP。 服务器故障&初检: 服务器和磁盘阵列设备从老机房搬迁到新机房,将所有线路连接好后开机发现服务器无法识别RAID,提示未初始化。
服务器数据恢复环境: 服务器采用的Linux操作系统+EXT4文件系统; 服务器中有3台KVM虚拟机:一台运行Mysql数据库,一台存放数据库备份,一台存放程序代码文件; 每台虚拟机包含一个qcow2格式的磁盘文件和一个raw格式的磁盘文件。 服务器故障: 工作人员的误操作将服务器上的3台KVM虚拟机都删除了,需要恢复raw格式的磁盘文件。
存储数据恢复环境: NetApp存储设备,WAFL文件系统,底层是由多块硬盘组建的raid磁盘阵列。 存储故障: 工作人员误操作导致NetApp存储内部分重要数据被删除。
ESXI上共有数十台虚拟机,EXSI连接一台HP EVA存储,所有虚拟机都存放在该EVA存储上。 其中一台虚拟机是数年前从物理机迁移过来的,其上部署了一个SQL SERVER数据库,该数据库存放了最近几年的数据。
服务器数据恢复环境: 同友存储,底层由数块物理硬盘组建的raid5磁盘阵列,存储池划分若干lun,每个lun下有数台虚拟机。 服务器故障: 未知原因导致存储崩溃,无法启动,虚拟机全部丢失,其中一个lun中的3台虚拟机数据尤为重要,需要恢复其中的数据。
某品牌StorageWorks存储设备,8块磁盘组建一组raid5磁盘阵列。存储中2块磁盘掉线导致阵列崩溃,经过检查发现掉线的2块磁盘均存在物理故障。
数据库数据恢复环境: 5块磁盘组建RAID5,划分LUN供windows服务器使用; windows服务器上部署Sql Server数据库;操作系统层面划分了三个逻辑分区。 数据库故障&初检: 未知原因导致Sql Server数据库文件丢失,涉及到数个数据库和数千张表,不能确定数据存储位置。数据库文件丢失后服务器仍然在开机运行,所幸没有大量写入数据。
数据库数据恢复环境: 某公司存储上部署SQL SERVER数据库,数据库中有1000多个文件,该SQL SERVER数据库每10天生成一个NDF文件,数据库包含两个LDF文件。 数据库故障&分析: 存储设备出现故障导致SQL SERVER数据库异常,经过检测发现有几个ndf文件大小变为0KB。 虽然存储故障导致NDF文件大小变为0KB,但是数据恢复工程师推测NDF文件还存在于磁盘中。可以通过编写数据库扫描碎片程序扫描数据库碎片,通过碎片拼接来恢复NDF文件,最后修复数据库。
服务器故障环境: HP MSA某型号存储,8块SAS的硬盘组建RAID5磁盘阵列,其中包括1块热备盘。故障存储中基于该RAID组的LUN均分配给HP-Unix小机使用,上层做的LVM逻辑卷,存储的数据为Oracle数据库及OA服务端。 服务器故障: RAID5磁盘阵列中2块磁盘未知原因离线,阵列中的热备盘虽然成功激活,RAID5磁盘阵列瘫痪,上层LUN不可用。
Oracle数据库常见数据灾难: 1、ORACLE数据库无法启动或无法正常运行。 2、ORACLE ASM存储破坏。 3、ORACLE数据库数据文件丢失。 4、ORACLE数据库数据文件损坏。 5、ORACLE DUMP文件损坏。
服务器数据恢复环境: HP StorageWorks存储,10块磁盘组建了raid5磁盘阵列,其中有1块磁盘是热备盘。 服务器故障: raid5磁盘阵列中2块磁盘离线,硬盘指示灯显示黄色。管理员经过初步检查,发现磁盘阵列的磁盘序列号不能读取且无法通过扩展卡识别,初步推断离线磁盘出现物理故障。
服务器数据恢复环境: 磁盘柜+raid卡+15块磁盘组建一组raid5磁盘阵列,划分2个lun; 上层操作系统划分若干分区,通过LVM扩容方式将其中一个分区加入到了root_lv中,其他分区格式化为XFS文件系统。 服务器故障: 为服务器重装操作系统时误操作导致分区发生改变,存放重要数据的一个分区丢失,无法访问。
由于raid的特点和优势,磁盘阵列技术被广泛应用于服务器和存储等商用领域。由于用户基数大,出现故障的情况也不少。通过这篇文章介绍一下常见的raid磁盘阵列数故障类型和原因。
服务器数据恢复环境: IBM Storwize某型号存储,共10块磁盘,组建了2组Mdisk加入到一个存储池中,创建了一个通用卷存放数据,存放的数据包含oracle数据库。 服务器故障: 存储中其中一组Mdisk有两块磁盘出现故障离线,该组Mdisk失效,通用卷不可用。
服务器数据恢复环境: DELL EqualLogic PS系列某型号存储; 16块SAS硬盘组成一组RAID5; 划分了4个卷,采用VMFS文件系统,存放虚拟机文件。 服务器故障: 存储设备中磁盘出现故障导致存储不可用,且存储设备已经过保,用户方联系到我们数据恢复中心要求恢复该存储设备中的数据。
数据库数据恢复环境: Windows Server操作系统服务器,部署MongoDB数据库。 数据库故障&分析: 在MongoDB数据库服务未关闭的情况下,管理员将MongoDB数据库文件从原分区拷贝到其他分区,然后将MongoDB数据库所在原分区格式化,格式化完成又将MongoDB数据库文件拷回原分区,启动MongoDB服务失败并报错。
服务器数据恢复环境: 昆腾系列存储:9个配置24块硬盘的磁盘柜。8个磁盘柜存储数据,1个磁盘柜存储元数据。 元数据磁盘柜有24块硬盘,组建了8组RAID1阵列+1组4盘位RAID10阵列+4个全局热备盘。 数据磁盘柜组建了32组6盘RAID5阵列。这32组RAID阵列分为2个存储系统。 存储及文件系统架构大致如下: 服务器故障: 数据磁盘柜其中1个存储系统中的一组RAID5的2块磁盘先后故障离线,该RAID5阵列失效,导致整个存储系统无法使用。
Copyright © 2005-2023 51CTO.COM 版权所有 京ICP证060544号