磁盘柜更换硬盘

公司磁盘柜链接一个光纤交换机,通过光纤跳线链到两台服务器上,文件服务器和邮件服务器。

2011-9-17日早上,文件服务器访问缓慢(以前也曾出现过访问缓慢的情况,当时对文件服务器的操作过程中删除比较大的备份文件,导致盘柜缓存没有释放,重新启动盘柜后访问正常了),重新启动盘柜后可正常访问。9-18号,文件服务器死机,重新启动文件服务器,访问正常。连续两天文件服务器出问题,查看日志,发现disk出错,驱动程序在\Device\harddisk0上检测到错误。在磁盘管理里面,disk0就是磁盘柜。

使用管理软件连接到盘柜,查看日志,发现一块硬盘没有工作,一块硬盘坏了,一块硬盘在预报警,问题严重,赶紧打800电话报修,然后把日志导出来传给800的工程师,下午接到电话,800工程师说盘柜硬盘不是ibm正品,不在保修范围内。没有办法,只有打供应商的电话,供应商带着工程师过来,看了现场,发现更换一块新硬盘后,数据无法同步,需要对硬盘进行操作,但是担心在操作的过程中,阵列信息会丢失,虽然几率很小,但还是建议把数据备份出来,公司最近几年的数据都保存在该盘柜上的,虽然增量备份到另外一台pc上面的,但是备份数据不是最新的,还有一些不是关键数据没有备份,所以只有把现在的数据拷贝出来。

供应商拿了一个盘柜过来(ds3512,供给另外一个机构的,暂时先借用,双控制器,82tsata硬盘),在服务器上再接张光卡,然后把3512直接连接在服务器上面,然后开始了漫长的数据拷贝。

以前有过分离文件服务器的经验,就是把数据按照年份分别存储,使用robocopy这个命令,添加以下参数

robocopy  源文件夹  目标文件夹 /e /xf *.tmp *.bak /maxage:20100101  /copyall /e表示要拷贝所有的文件夹,/xf表示后面类型的文件夹不拷贝,/maxage表示到现在为止所有修改过的文件,/copyall表示拷贝所有的文件属性。

       文件服务器和邮件服务器总共的数据为10T左右,并且都是比较小的文件,文件服务器还好,单文件大小平均在1m 左右,邮件服务器保存的就是一封封邮件,平均大小在50k左右,由这些数据组成大约10T的数据。在拷贝的过程中使用该命令:

robocopy F:\文件夹  Z:\文件夹  /e /R:3 /W:3 /xf *.tmp *.bak /copyall

z盘为新的盘柜的盘符,因为用的ntfs权限,开始给的是用户完全控制的权限,有的同事在自己的文件夹上把管理员权限删除了,所以在拷贝的过程中会提示拒绝拷贝,然后该命令会在一定的时间内尝试再次拷贝,所以比上次多添加了2个参数,/r /w。从拷贝的结果来看,用该命令,在文件服务器上的速度到到600MegaBytes/min,邮件服务器达到速度: 150 MB/min

       在拷贝的过程中也考虑使用ftp拷贝,现成的软件有serv-U,架设后使用ftp软件进行拷贝,结果没有实现。用ftp拷贝数据,数据能够达到50mbps,但是在拷贝了34个小时以后会ftp服务器软件会假死,并且ftp客户端软件也会出现问题,ftp下载软件是支持断点续传的,但是没有办法达到无人值守。

       数据拷贝从9-21晚上到9-25晚上才拷贝完成,本来想把盘柜重新做过阵列,现在是一个阵列—raid6,一块热备盘,想做成2raid5,每个阵列用一块热备盘,结果数据拷贝花费的时间太多,并且在拷贝的过程中还跳过一些文件和在拷贝的过程中更新的文件,所以就放弃了。

       因为坏的是2块硬盘,把两块硬盘放进去后,在软件上操作,对其中的一块硬盘进行同步,在同步的过程中再对另外一块硬盘进行同步,另外一块硬盘不能够工作,只有等第一块硬盘同步完成后再同步另外一块硬盘。当第一块硬盘插上去后,指示灯闪其,数据在同步过程中,大家都舒了一口气,先前担心的严重后果没有出现。

       第一块硬盘同步花费的时间从9-25号晚上9点到9-27早上,现在正在同步第二块硬盘,该硬盘同步完成后,再把预报警的那块硬盘更换掉。

       总结:

1该盘柜第一次硬盘坏是在8月份,打800电话,告知硬盘的部件号,然后快递一块硬盘过来,但是快递公司要把旧的硬盘拿走,就直接拔插硬盘,后来也没有登录上去查看,直到这次阵列出现问题,然后才发现我们的磁柜上面是23sas+1satasata的硬盘就是先前更换的硬盘,并且这个硬盘一直没有工作。以后再遇到存储出现了问题,一定要ibm的工程师×××,毕竟数据是无价的,还有需要注意备份。

       2 疑问,硬盘上的标识是43w7633,在软件里面认的是sas硬盘,但是在网络上查找,该型号的硬盘是sata硬盘,那么供应商卖给我们的硬盘是什么硬盘?

       3 小文件的数据拷贝,除了在命令行下用ropocopy拷贝和ftp以外,还有什么命令或者是软件拷贝的速度更快一些?在拷贝的过程中除了需要注意断点续传以外,还有拷贝的过程中的更新文件怎么拷贝的问题。