zabbix监控windows磁盘空间的触发器磁盘监测

转载

jkfox 2024-04-26 10:42:51

文章标签 运维操作系统 .net linux 服务器 文章分类 运维

smartctl --all

smartctl 磁盘健康监测程序

SMART是一种磁盘自我分析检测技术，早在90年代末就基本得到了普及每一块硬盘（包括IDE、SCSI）在运行的时候，都会将自身的若干参数记录下来这些参数包括型号、容量、温度、密度、扇区、寻道时间、传输、误码率等

硬盘运行了几千小时后，很多内在的物理参数都会发生变化某一参数超过报警阈值，则说明硬盘接近损坏

此时硬盘依然在工作，如果用户不理睬这个报警继续使用那么硬盘将变得非常不可靠，随时可能故障

SMART是和主板BIOS上相应功能配合的

要使用SMART，必须先进入到主板BIOS设置里边启动相关设置

一般从Pentium2级别起的主板，都支持SMART

BIOS启动以后，就是操作系统级别的事情了.很遗憾，Windows没有内置SMART相关工具（需要安装第三方工具软件）

好在Linux上很早就有了SMART支持了.如果把Linux装在VMware等虚拟机上，在系统启动时候可以看到有个服务启动报错：smartd

这个服务器就是smart的daemon进程（因为vmware虚拟机的硬盘不支持SMART，所以报错）

首先通过dmesg工具，确认一下硬盘的设备符号

hdb中的h代表IDE，如果显示为sdb，则代表SATA和SCSI
最后一个字幕b代表Primary总线，第二块硬盘即Slave位置

-i 指定设备
-d 指定设备类型,例如：ata, scsi, marvell, sat, 3ware,N
-a 或A 显示所有信息
-l 指定日志的类型，例如:TYPE: error, selftest, selective, directory,background, scttemp[sts,hist]
-H 查看硬盘健康状态
-t short 后台检测硬盘，消耗时间短
-t long 后台检测硬盘，消耗时间长
-C -t short 前台检测硬盘，消耗时间短
-C -t long 前台检测硬盘，消耗时间长
-X 中断后台检测硬盘
-l selftest 显示硬盘检测日志

确认硬盘是否打开了SMART支持

smartctl -i /dev/hdb
 
  

     [root@station ~]# smartctl -i /dev/sdb 
   
 
   

     smartctl 5.39.1 2010-01-28 r3054 [i386-redhat-linux-gnu] (local build) 
   
 
   

     Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net 
   
 
   
 
    
 
   

     Device: SEAGATE  ST373453LC       Version: 0006 
   
 
   

     Serial number: 3HW07M7K00007340AX57 
   
 
   

     Device type: disk 
   
 
   

     Transport protocol: Parallel SCSI (SPI-4) 
   
 
   

     Local Time is: Tue Nov  6 16:54:06 2012 CST 
   
 
   
Device supports SMART and is Enabled
 
   

     Temperature Warning Enabled

如果看到不支持这需要我们手动开启支持

smartctl --smart=on --offlineauto=on --saveauto=on /dev/sdb  //手动开启smart命令
 
   

     smartctl 5.39.1 2010-01-28 r3054 [i386-redhat-linux-gnu] (local build) 
   
 
   

     Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net 
   
 
   
 
    
 
   

     Informational Exceptions (SMART) enabled 
   
 
   

     Temperature warning enabled 
   
 
  

     [root@station ~]# smartctl  -H /dev/sdb  //磁盘健康状况查看 
   
 
   

     smartctl 5.39.1 2010-01-28 r3054 [i386-redhat-linux-gnu] (local build) 
   
 
   

     Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net 
   
 
   
 
    
 
   

     SMART Health Status: OK

注意后边的结果：这表示硬盘健康状态良好

如果这里显示Failure，那么最好立刻给服务器更换硬盘

SMART只能报告磁盘已经不再健康，但是报警后还能继续运行多久是不确定的

通常，SMART报警参数是有预留的，磁盘报警后，不会当场坏掉，一般能坚持一段时间

有的硬盘SMART报警后还继续跑了好几年，有的硬盘SMART报错后几天就坏了

但是一旦出现报警，侥幸心里是万万不能的……

简单用法：
1、smartctl -a  <device>       检查该设备是否已经打开SMART技术。
2、smartctl -s on <device> 如果没有打开SMART技术，使用该命令打开SMART技术。
3、smartctl -t short <device> 后台检测硬盘，消耗时间短；
smartctl -t long <device>    后台检测硬盘，消耗时间长；
smartctl -C -t short <device> 前台检测硬盘，消耗时间短；
smartctl -C -t long <device>  前台检测硬盘，消耗时间长。
其实就是利用硬盘SMART的自检程序。
4、smartctl -X <device>  中断后台检测硬盘。
5、smartctl -l selftest <device>  显示硬盘检测日志。
6、smartctl -l error <device> 显示硬盘错误汇总。

转载于:https://blog.51cto.com/chaorenyong/1051859

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。