原文出处: Mike Xu 的博客
最近时不时有朋友问我关于服务器监控方面的问题,问常用的服务器监控除了用开源软件,比如:cacti,nagios监控外是否可以自己写shell脚本呢?根据自己的需求写出的shell脚本更能满足需求,更能细化主机监控的全面性。
下面是我常用的几个主机监控的脚本,大家可以根据自己的情况在进行修改,希望能给大家一点帮助。
1、查看主机网卡流量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | #!/bin/bash #!/bin/bash #network #Mike.Xu while : ; do
time = 'date +%m"-"%d" "%k":"%M'
day= 'date +%m"-"%d'
rx_before= 'ifconfig eth0|sed -n "8"p|awk ' {print $2} '|cut -c7-'
tx_before= 'ifconfig eth0|sed -n "8"p|awk ' {print $6} '|cut -c7-'
sleep 2
rx_after= 'ifconfig eth0|sed -n "8"p|awk ' {print $2} '|cut -c7-'
tx_after= 'ifconfig eth0|sed -n "8"p|awk ' {print $6} '|cut -c7-'
rx_result=$[(rx_after-rx_before) /256 ]
tx_result=$[(tx_after-tx_before) /256 ]
echo "$time Now_In_Speed: " $rx_result "kbps Now_OUt_Speed: " $tx_result "kbps"
sleep 2 done done |
2、系统状况监控
1 2 3 4 5 6 7 8 9 10 11 12 13 | #!/bin/sh #systemstat.sh #Mike.Xu IP=192.168.1.227 top -n 2| grep "Cpu" >>. /temp/cpu .txt free -m | grep "Mem" >> . /temp/mem .txt df -k | grep "sda1" >> . /temp/drive_sda1 .txt #df -k | grep sda2 >> ./temp/drive_sda2.txt df -k | grep "/mnt/storage_0" >> . /temp/mnt_storage_0 .txt df -k | grep "/mnt/storage_pic" >> . /temp/mnt_storage_pic .txt time =` date +%m "." %d " " %k ":" %M` connect=` netstat -na | grep "219.238.148.30:80" | wc -l` echo "$time $connect" >> . /temp/connect_count .txt |
3、监控主机的磁盘空间,当使用空间超过90%就通过发mail来发警告
1 2 3 4 5 6 7 | #!/bin/bash #monitor available disk space SPACE= 'df | sed -n ' / \ / $ / p ' | gawk ' {print $5} ' | sed ' s/% // ' if [ $SPACE - ge 90 ] then fty89@163.com fi |
4、 监控CPU和内存的使用情况
1 2 3 4 5 6 7 8 9 10 11 12 | #!/bin/bash #script to capture system statistics OUTFILE= /home/xu/capstats .csv DATE= 'date +%m/%d/%Y' TIME= 'date +%k:%m:%s' TIMEOUT= 'uptime' VMOUT= 'vmstat 1 2'
USERS= 'echo $TIMEOUT | gawk ' {print $4} ' ' LOAD= 'echo $TIMEOUT | gawk ' {print $9} ' | sed "s/,//' ' FREE= 'echo $VMOUT | sed -n ' /[0-9] /p ' | sed -n ' 2p ' | gawk ' {print $4} ' ' IDLE= 'echo $VMOUT | sed -n ' /[0-9] /p ' | sed -n ' 2p ' |gawk ' {print $15} ' ' echo "$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE" >> $OUTFILE |
5、全方位监控主机
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 | #!/bin/bash # check_xu.sh # 0 * * * * /home/check_xu.sh DAT= "`date +%Y%m%d`" HOUR= "`date +%H`" DIR= "/home/oslog/host_${DAT}/${HOUR}" DELAY=60 COUNT=60 # whether the responsible directory exist if ! test -d ${DIR} then
/bin/mkdir -p ${DIR} fi # general check export TERM=linux /usr/bin/top -b -d ${DELAY} -n ${COUNT} > ${DIR} /top_ ${DAT}.log 2>&1 & # cpu check /usr/bin/sar -u ${DELAY} ${COUNT} > ${DIR} /cpu_ ${DAT}.log 2>&1 & #/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}.log 2>&1 & #/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}.log 2>&1 & # memory check /usr/bin/vmstat ${DELAY} ${COUNT} > ${DIR} /vmstat_ ${DAT}.log 2>&1 & # I/O check /usr/bin/iostat ${DELAY} ${COUNT} > ${DIR} /iostat_ ${DAT}.log 2>&1 & # network check /usr/bin/sar -n DEV ${DELAY} ${COUNT} > ${DIR} /net_ ${DAT}.log 2>&1 & #/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}.log 2>&1 & |
放在crontab里每小时自动执行:
1 | 0 * * * * /home/check_xu .sh |
这样会在/home/oslog/host_yyyymmdd/hh目录下生成各小时cpu、内存、网络,IO的统计数据。
如果某个时间段产生问题了,就可以去看对应的日志信息,看看当时的主机性能如何。