关于nagios邮件报警(3版本)

 
前提:25端口开启(sendmail或postfix),监控机能连外网。


1、localhost.cfg是默认关闭邮件的,需手动开启,很简单,只需两步:


# vi /usr/local/nagios/etc/objects/localhost.cfg


将  notifications_enabled   0 改为 1,

:wq


# vi /usr/local/nagios/etc/objects/contacts.cfg 

define contact { 

contact_name ming ;

use generic-contact ;

email 1376467954@139.com  ;       (最好写139邮箱直接发到手机上)


2、nrpe监控时邮件报警功能是默认开启的,至于怎么开的,在哪指定的,暂时还不清楚,可以不去管,只要把邮箱写上就行了


# vi /usr/local/nagios/etc/objects/contacts.cfg 

define contact { 

contact_name ming ;

use generic-contact ;

email 1376467954@139.com  ;       (最好写139邮箱直接发到手机上)


3、说明一点的是,139邮箱(移动邮箱)是发送到手机的,相当于飞信,填写139邮箱,飞信的那些东西就显得没必要了。


4、关于邮件发送时间问题,nagios默认10分钟更新一次(当然可以自己改的,这个另说),就是说10分钟内的变化它是不管的,比如,10分钟内服务重启了,甚至电脑重启了,它都不会显示、记录(因为它压根就不知道)。服务宕了之后,默认的10分钟之后才会显示,那么是不是显示之后就立即报警哪?不是的。
它有个3次确认的机制,基本是2分钟确认一次,3/3,才算彻底确认,刚显示的时候就已经是1/3了,就是说4-5分钟完成3次确认。这时它才会给你发信息报警。也就是说服务宕后很可能15分钟后才告诉你。当然这对公司来说肯定是不允许的,改是必须的,怎样改这里不介绍,后边会单独说,这里只是先介绍下它的发邮件过程。


5、服务宕了之后它会发邮件通知,服务由宕变正常之后也会发邮件通知,还有可能会把昨天的前天的甚至更早的也发给你,真正用手机接收的话要有这个心理准备。