用DELL服务器的午饭们想必都应该知道在Windows环境下的"Server Administrator"通过这个工具可以很方便的查看出服务器当前硬件的工作情况。由于工作需我使用的很多DELL服务器均安装的Linux操作系统,cpu/内存倒还好说,可硬盘都是通过PERC 6/i SAS阵列控制器创建RAID组然后提供给Linux系统使用的。而平时日常维护工作都是通过ssh文本模式远程登录到服务器的,为了能够在硬盘挂了以后及时亡羊补牢从DELL网站上找到了一个不错的软件dell-onlinediags-linux,这个软件功能很强大本文仅仅使用它的存储设备检测功能,其他的功能大家可以详细研究一下帮助文档,在此就不一一列出了。


第一步,获取软件
在 ftp://ftp.us.dell.com/diags/ 找到dell-onlinediags-linux软件包,现在最新版本是2.17.0.44。已经可以支持RedHat6了。我是在Centos5.5 x86_64系统上测试的,可以使用RHEL5的rpm包。

第二步,解压安装(本例下载tar包到/tmp目录下)

cd /tmp

tar zxvf dell-onlinediags-linux-2.17.0.44.tar.gz

cd onliediags

rpm -ivh RHEL5/srvadmin-hapi-6.4.0-1.42.1.el5.i386.rpm

rpm -ivh x86_64/pediags-storelib-sysfs-6.4.0-1.2.1.el4.i386.rpm (如果是32bit系统安装RHEL5目录下的srvadmin-storelib-sysfs-6.4.0-1.4.2.el5.i386.rpm )

rpm -ivh dell-onlinediags-2.17.0-44.i386.rpm

第三步,检测查询

cd /opt/dell/onlinediags/oldiags/bin

./pediags sasdevdiag --run quicktest=true

 

 

The available device class(es) are:

可检测:

Command       : Description

cddvd         : Runs CDDVD diagnostics.

floppy        : Runs Floppy diagnostics.

memory        : Runs Memory diagnostics.

modem         : Runs Modem diagnostics.

network       : Runs Network diagnostics.

rac           : Runs RAC diagnostics.

serialport    : Runs Serial Port diagnostics.

raidctrl      : Runs diagnostics for Dell SCSI RAID devices.

idedevdiag    : Runs diagnostics for IDE and SATA devices.

sasdevdiag    : Runs diagnostics for Dell SAS non-RAID and SAS RAID devices.

swraiddevdiag : Runs diagnostics for Dell SWRAID devices.

scsidevdiag   : Runs diagnostics for Dell SCSI non-RAID devices.

usbctrl       : Runs diagnostics for USB Root Hubs.

fcdevdiag     : Runs diagnostics for Fibre Channel Devices.

然后屏幕会逐个出现一排小点.......耐心等待,这个要看磁盘多少了。我这里7块盘大概等了3分钟的样子吧。
然后会出现如下结果:

 

  1. ................................................................... 
  2. Device Name     : Dell PERC 6/i Integrated RAID Controller 1 
  3. Description     : Dell PERC 6/i Integrated RAID Controller 1 
  4. Device Location : PCI Bus 3, Device 0, Function 0 
  5. Test Name       : SAS Controller Log Test 
  6. Description     : Gets the Controller Events Log. 
  7. Passes          : 1 
  8. Result          : passed 
  9. Start Time      : Tue Mar 15 13:48:10 2011 
  10. Completion Time : Tue Mar 15 13:48:10 2011 
  11. Result Event    : The test operation completed successfully. No errors found. 
  12. Device Name     : Dell PERC 6/i Integrated RAID Controller 1 
  13. Description     : Dell PERC 6/i Integrated RAID Controller 1 
  14. Device Location : PCI Bus 3, Device 0, Function 0 
  15. Test Name       : Controller Self Test 
  16. Description     : Runs Self Diagnostics on the controller. 
  17. Passes          : 1 
  18. Result          : passed 
  19. Start Time      : Tue Mar 15 13:48:12 2011 
  20. Completion Time : Tue Mar 15 13:49:52 2011 
  21. Result Event    : The test operation completed successfully. No errors found. 
  22. Event String 1  : NVRAM test completed 37 passes successfully 
  23. Event String 2  : Memory test completed 2 passes successfully 
  24. Event String 3  : DISK test completed 11 passes successfully 
  25. Event String 4  : XOR test completed 152 passes successfully 
  26. Event String 5  : DMA test completed 18 passes successfully 
  27. Event String 6  : Controller Battery Backup Unit Working Normally 
  28. Device Name     : Dell PERC 6/i Integrated RAID Controller 1 
  29. Description     : Dell PERC 6/i Integrated RAID Controller 1 
  30. Device Location : PCI Bus 3, Device 0, Function 0 
  31. Test Name       : Controller TTY Log Test 
  32. Description     : Gets the Controller TTY Log. 
  33. Passes          : 1 
  34. Result          : passed 
  35. Start Time      : Tue Mar 15 13:49:58 2011 
  36. Completion Time : Tue Mar 15 13:49:58 2011 
  37. Result Event    : The test operation completed successfully. No errors found. 
  38. Device Name     : SAS/SATA backplane 1:0 
  39. Description     : SAS/SATA backplane 1:0 
  40. Device Location : Enclosure 1:0 
  41. Test Name       : SAS Phy Integrity Test 
  42. Description     : Gets Enclosure and HDD Phy Error Log Information. 
  43. Passes          : 1 
  44. Result          : passed 
  45. Start Time      : Tue Mar 15 13:48:12 2011 
  46. Completion Time : Tue Mar 15 13:49:57 2011 
  47. Result Event    : The test operation completed successfully. No errors found. 
  48. Device Name     : Array Disk 1:0:0 
  49. Description     : SAS TOSHIBA MBF2300RC 
  50. Device Location : Slot 0 
  51. Test Name       : Disk Self Test 
  52. Description     : Tests the hard drive. 
  53. Passes          : 1 
  54. Result          : passed 
  55. Start Time      : Tue Mar 15 13:48:12 2011 
  56. Completion Time : Tue Mar 15 13:49:09 2011 
  57. Result Event    : The test operation completed successfully. No errors found. 
  58. Device Name     : Array Disk 1:0:0 
  59. Description     : SAS TOSHIBA MBF2300RC 
  60. Device Location : Slot 0 
  61. Test Name       : Disk Blink Test 
  62. Description     : Blinks the hard drive. 
  63. Passes          : 1 
  64. Result          : passed 
  65. Start Time      : Tue Mar 15 13:49:16 2011 
  66. Completion Time : Tue Mar 15 13:49:46 2011 
  67. Result Event    : The test operation completed successfully. No errors found. 
  68. Device Name     : Array Disk 1:0:1 
  69. Description     : SAS TOSHIBA MBF2300RC 
  70. Device Location : Slot 1 
  71. Test Name       : Disk Self Test 
  72. Description     : Tests the hard drive. 
  73. Passes          : 1 
  74. Result          : passed 
  75. Start Time      : Tue Mar 15 13:48:12 2011 
  76. Completion Time : Tue Mar 15 13:49:09 2011 
  77. Result Event    : The test operation completed successfully. No errors found. 
  78. Device Name     : Array Disk 1:0:1 
  79. Description     : SAS TOSHIBA MBF2300RC 
  80. Device Location : Slot 1 
  81. Test Name       : Disk Blink Test 
  82. Description     : Blinks the hard drive. 
  83. Passes          : 1 
  84. Result          : passed 
  85. Start Time      : Tue Mar 15 13:49:16 2011 
  86. Completion Time : Tue Mar 15 13:49:46 2011 
  87. Result Event    : The test operation completed successfully. No errors found. 
  88. Device Name     : Array Disk 1:0:2 
  89. Description     : SAS TOSHIBA MBF2300RC 
  90. Device Location : Slot 2 
  91. Test Name       : Disk Self Test 
  92. Description     : Tests the hard drive. 
  93. Passes          : 1 
  94. Result          : passed 
  95. Start Time      : Tue Mar 15 13:48:12 2011 
  96. Completion Time : Tue Mar 15 13:49:04 2011 
  97. Result Event    : The test operation completed successfully. No errors found. 
  98. Device Name     : Array Disk 1:0:2 
  99. Description     : SAS TOSHIBA MBF2300RC 
  100. Device Location : Slot 2 
  101. Test Name       : Disk Blink Test 
  102. Description     : Blinks the hard drive. 
  103. Passes          : 1 
  104. Result          : passed 
  105. Start Time      : Tue Mar 15 13:49:16 2011 
  106. Completion Time : Tue Mar 15 13:49:46 2011 
  107. Result Event    : The test operation completed successfully. No errors found. 
  108. Device Name     : Array Disk 1:0:3 
  109. Description     : SAS TOSHIBA MBF2300RC 
  110. Device Location : Slot 3 
  111. Test Name       : Disk Self Test 
  112. Description     : Tests the hard drive. 
  113. Passes          : 1 
  114. Result          : passed 
  115. Start Time      : Tue Mar 15 13:48:12 2011 
  116. Completion Time : Tue Mar 15 13:49:05 2011 
  117. Result Event    : The test operation completed successfully. No errors found. 
  118. Device Name     : Array Disk 1:0:3 
  119. Description     : SAS TOSHIBA MBF2300RC 
  120. Device Location : Slot 3 
  121. Test Name       : Disk Blink Test 
  122. Description     : Blinks the hard drive. 
  123. Passes          : 1 
  124. Result          : passed 
  125. Start Time      : Tue Mar 15 13:49:06 2011 
  126. Completion Time : Tue Mar 15 13:49:36 2011 
  127. Result Event    : The test operation completed successfully. No errors found. 
  128. Device Name     : SAS/SATA backplane 1:0 
  129. Description     : SAS/SATA backplane 1:0 
  130. Device Location : Enclosure 1:0 
  131. Test Name       : SAS Phy Integrity Test 
  132. Description     : Gets Enclosure and HDD Phy Error Log Information. 
  133. Passes          : 1 
  134. Result          : passed 
  135. Start Time      : Tue Mar 15 13:50:00 2011 
  136. Completion Time : Tue Mar 15 13:51:22 2011 
  137. Result Event    : The test operation completed successfully. No errors found. 
  138. Device Name     : Array Disk 1:0:4 
  139. Description     : SAS TOSHIBA MBF2300RC 
  140. Device Location : Slot 4 
  141. Test Name       : Disk Self Test 
  142. Description     : Tests the hard drive. 
  143. Passes          : 1 
  144. Result          : passed 
  145. Start Time      : Tue Mar 15 13:48:12 2011 
  146. Completion Time : Tue Mar 15 13:49:04 2011 
  147. Result Event    : The test operation completed successfully. No errors found. 
  148. Device Name     : Array Disk 1:0:4 
  149. Description     : SAS TOSHIBA MBF2300RC 
  150. Device Location : Slot 4 
  151. Test Name       : Disk Blink Test 
  152. Description     : Blinks the hard drive. 
  153. Passes          : 1 
  154. Result          : passed 
  155. Start Time      : Tue Mar 15 13:49:10 2011 
  156. Completion Time : Tue Mar 15 13:49:40 2011 
  157. Result Event    : The test operation completed successfully. No errors found. 
  158. Device Name     : Array Disk 1:0:5 
  159. Description     : SAS TOSHIBA MBF2300RC 
  160. Device Location : Slot 5 
  161. Test Name       : Disk Self Test 
  162. Description     : Tests the hard drive. 
  163. Passes          : 1 
  164. Result          : passed 
  165. Start Time      : Tue Mar 15 13:48:12 2011 
  166. Completion Time : Tue Mar 15 13:49:06 2011 
  167. Result Event    : The test operation completed successfully. No errors found. 
  168. Device Name     : Array Disk 1:0:5 
  169. Description     : SAS TOSHIBA MBF2300RC 
  170. Device Location : Slot 5 
  171. Test Name       : Disk Blink Test 
  172. Description     : Blinks the hard drive. 
  173. Passes          : 1 
  174. Result          : passed 
  175. Start Time      : Tue Mar 15 13:49:12 2011 
  176. Completion Time : Tue Mar 15 13:49:42 2011 
  177. Result Event    : The test operation completed successfully. No errors found. 
  178. Device Name     : Array Disk 1:0:6 
  179. Description     : SAS TOSHIBA MBF2300RC 
  180. Device Location : Slot 6 
  181. Test Name       : Disk Self Test 
  182. Description     : Tests the hard drive. 
  183. Passes          : 1 
  184. Result          : passed 
  185. Start Time      : Tue Mar 15 13:48:12 2011 
  186. Completion Time : Tue Mar 15 13:49:04 2011 
  187. Result Event    : The test operation completed successfully. No errors found. 
  188. Device Name     : Array Disk 1:0:6 
  189. Description     : SAS TOSHIBA MBF2300RC 
  190. Device Location : Slot 6 
  191. Test Name       : Disk Blink Test 
  192. Description     : Blinks the hard drive. 
  193. Passes          : 1 
  194. Result          : passed 
  195. Start Time      : Tue Mar 15 13:49:14 2011 
  196. Completion Time : Tue Mar 15 13:49:44 2011 
  197. Result Event    : The test operation completed successfully. No errors found. 

结果中有下划线标出的那部分就是第一块硬盘disk1:0:0的测试结果,看完全部结果很清楚的就能看出来Slot 0—Slot 6
一共7块硬盘每块盘测试两次,每次都是正常的。看到这样的结果心理终于踏实了,这样即便人没有在IDC机房托管服务器前,也一样可以知道服务器当前所有硬盘的工作状态了。写个脚本crontab每隔3天测试一次然后发封邮件给自己,这样是不是就再也不必担心硬盘挂了呢?

原文连接:http://bbs.51cto.com/thread-817166-1.html