Nagios

Nagios是一款开源软件,可以监控网络设备的流量、linuxwindows主机状态、监控打印机,可运行在linux上、windows上,给予web界面上监控,支持web界面配置、管理操作,支持短信、邮件通知。

 

一、服务端安装基于httpd服务配置)

##安装nagios相关的源

yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

##设置nagios登陆账号密码,账号为nagiosadmin 密码为123456

htpasswd -c /etc/nagios/passwd nagiosadmin

##查看配置文件是否有错

nagios v /etc/nagios/nagios.cfg

##启动服务

service httpd start;service nagios start

##若安装不成功,则需要安装epel

wget www.lishiming.net/data/p_w_upload/forum/epel-release-6-8_64.noarch.rpm

rpm -ivh epel-release-6-8_64.noarch.rpm

 

二、客户端安装(被监控端)

##安装nagios相关的源

yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

##修改配置文件

vim /etc/nagios/nrpe.cfg

##PS修改此处allowed_hosts=127.0.0.1,115.159.41.46  ##表示允许被这IP地址连接

##修改此处dont_blame_nrpe=0    把0修改为1

##启动客户端

/etc/init.d/nrpe start

 

三、在服务端添加需要监控的主机

##添加配置文件

vim /etc/nagios/conf.d/yichuangshe.cfg     ##cfg文件为自定义名字

##加入一下内容:

define host{

         use                    linux-server

         host_name              120.24.98.198

         alias                  Yichuangshe

         address                120.24.98.198

         }

 

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_ping

          check_command           check_ping!100.0,20%!200.0,50%

          max_check_attempts 5

          normal_check_interval 1

}

 

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_ssh

          check_command           check_ssh

          max_check_attempts 5

          normal_check_interval 1

}

 

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_http

          check_command           check_http

          max_check_attempts 5

          normal_check_interval 1

}

##max_check_attempts 5   表示尝试检测5次有问题才告警

##normal_check_interval 1  表示重新检测时间为1分钟,默认单位为分钟

##增加扩展监控入登陆、硬盘信息等

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_load

          check_command           check_nrpe!check_load

          max_check_attempts 5

          normal_check_interval 1

}

 

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_disk_hda1

          check_command           check_nrpe!check_hda1

          max_check_attempts 5

          normal_check_interval 1

}

define service{

          use                generic-service

          host_name          120.24.98.198

          service_description     check_disk_ hda2

          check_command           check_nrpe!check_hda2

          max_check_attempts 5

          normal_check_interval 1

}

   ##如:check_ nrpe!check_load_ hda2  中的check_nrpe对应服务端的etc/nagios/objects/commands.cfg文件,!后面的check_load_hda2表示客户端的/etc/nagios/nrpe.cfg文件

##增加其他监控项目

vim /etc/nagios/objects/commands.cfg

###增加内容:

# 'check_nrpe' command definition

define command{

          command_name      check_nrpe

          command_line      $USER1!$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

}

##检查配置文件是否有误

nagios –v /etc/nagios/nagios.cfg

##重启nagios服务

/etc/init.d/nagios restart