1. Nagios安装 - 服务端

安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持

[root@localhost ~]# yum install -y epel-release

wKiom1c4UjagYMsGAAA-u5gqi-U115.png

[root@localhost ~]# wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo

wKioL1c4UyqgugWTAACBuwBeGN8050.png

安装nagios服务以及相关支持服务:

[root@localhost ~]# yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

wKioL1c4UzmRNES8AABSnWL662U470.png

创建用户和密码

[root@localhost ~]# htpasswd -c /etc/nagios/passwd nagiosadmin

wKioL1c4U0fjy360AAAr5PaMczM729.png

检测配置文件

[root@localhost ~]# nagios -v /etc/nagios/nagios.cfg

wKiom1c4UnDzHd2cAACpW8lSeug742.png

wKioL1c4U56xRkFBAABVdbLw0uE147.png

上图表示 配置正确 没有问题

启动服务:

wKiom1c4UsXTsmVBAAApg5OOzYA692.png

检测一下:

wKioL1c4U7SBjmTKAAA1QP__idQ531.png

wKiom1c4UtujNYGOAABNPbb7uw8991.png

浏览器访问: http://ip/nagios

wKioL1c4U8yQLqeBAACGmP6rDmo712.png

如果没有得到上面的结果,请检查selinux和iptables,输入上面建立的用户名和密码

wKioL1c4VAbw-GRhAAKdb1l5I1Y671.png

可以看到我安装的版本是3.5.1。

2. Nagios安装 - 客户端

安装扩展YUM源(2个都可以,但是epel-release只有6.7版本才可以,6.7以前版本不支持

[root@localhost ~]# yum install -y epel-release

wKiom1c4UyyBcSS6AAA-u5gqi-U633.png

[root@localhost ~]# wget -P /etc/yum.repos.d/ http://mirrors.aliyun.com/repo/epel-6.repo

wKiom1c4UzfDLZq2AACBuwBeGN8160.png

安装nagios客户端服务

[root@localhost ~]# yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

wKioL1c4VC2BfisqAABqv8UMH_A416.png

编辑配置文件

[root@localhost ~]# vim /etc/nagios/nrpe.cfg

找到“allowed_hosts=127.0.0.1” 改为 “allowed_hosts=192.168.1.201”

allowed_hosts=192.168.1.201  定义服务器主机

找到” dont_blame_nrpe=0” 改为  “dont_blame_nrpe=1” 

dont_blame_nrpe=1

wKiom1c4U1nz60x6AABOOhq4fck511.png

启动服务

[root@localhost ~]# /etc/init.d/nrpe start

wKiom1c4U5miOFUYAAAbt-roAc0752.png

3. 监控中心(192.168.1.201)添加被监控主机(192.168.1.202)

编辑被监控主机配置文件

[root@localhost ~]# cd /etc/nagios/conf.d/

[root@localhost conf.d]# vim 192.168.1.202.cfg

define host{

        use                     linux-server            

        host_name           192.168.1.202

        alias                     1.202

        address                 192.168.1.202

        }

define service{

        use                     generic-service

        host_name               192.168.1.202

        service_description     check_ping

        check_command           check_ping!100.0,20%!200.0,50%

        max_check_attempts 5

        normal_check_interval 1

}

define service{

        use                     generic-service

        host_name               192.168.1.202

        service_description     check_ssh

        check_command           check_ssh

        max_check_attempts      5   

        normal_check_interval    1 

        notification_interval         60 

define service{

        use                     generic-service

        host_name               192.168.1.202

        service_description     check_http

        check_command           check_http

        max_check_attempts      5

        normal_check_interval    1

}

   max_check_attempts      5    ;当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警

   normal_check_interval    1   ;重新检测的时间间隔,单位是分钟,默认是3分钟

  notification_interval        60  ;在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。 

wKioL1c4VIqDYEJAAADCC19tEv4188.png

检测配置文件:

[root@localhost conf.d]# nagios -v /etc/nagios/nagios.cfg

wKiom1c4U6_RCEO1AAC0WxmG9eE169.png

wKioL1c4VKGAOEgXAABSFJ4kXzI394.png

重启服务:

wKiom1c4U8ezLZ5TAAAhtBpJq20809.png

去web查看一下监控情况

wKiom1c4U9LBIS_KAAE0uV_6biM467.png

wKioL1c4VPuRUi40AAHah2fZSuo493.png

4--监控客户端硬盘,内存情况

#由于需要nagios调用的监控命令都需要在command.cfg模块中定义 而前面的check_nrpe在默认的command.cfg中时没有的 

 这里需要在command.cfg中将其加入进去 现在去服务器端编辑/objects/commands.cfg

[root@nagios conf.d]# vim /etc/nagios/objects/commands.cfg

define command{

        command_name    check_nrpe

        command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

        }

定义check_nrpe编辑文件添加下面内容:

wKioL1c4VQmBP-PxAAAQfXHYRkg371.png

wKiom1c4VC3SN8MRAAAkZRrD7IA037.png

在服务器端配置被监控端的配置文件:

[root@localhost conf.d]# cd /etc/nagios/conf.d/

[root@localhost conf.d]# vim 192.168.1.202.cfg

define service{

        use     generic-service

        host_name       192.168.1.88

        service_description     check_load

        check_command           check_nrpe!check_load

        max_check_attempts 5

        normal_check_interval 1

}

define service{

        use     generic-service

        host_name       192.168.1.88

        service_description     check_disk_hda1

        check_command           check_nrpe!check_hda1

        max_check_attempts 5

        normal_check_interval 1

}

wKioL1c4VR-zZmR7AACgp_Gdka4924.png

客户端查看check_load,check_hda1服务

[root@localhost ~]# df -h

wKiom1c4VEfR3Uu0AAA1lKOsWIA051.png

[root@localhost ~]# vi /etc/nagios/nrpe.cfg

wKioL1c4VTnTQTx_AABcgiZ-o1Y918.png

查看一下已经监控到了 ok

wKiom1c4VF6xQbZ5AACfjDCeMzw666.png