一步步实现Nagios监控linux主机及飞信报警
一、下面就进入对其它linux主机实现nagios监控的配置
在被监控端的linux主机上:
1、先添加nagios用户来执行此服务
2、为了安装nrpe,先安装nagios-plugins-1.4.15.tar.gz 插件
- tar zxf nagios-plugins-1.4.15.tar.gz
- cd nagios-plugins-1.4.15
- ./configure --with-nagios-user=nagios --with-nagios-group=nagios
- make
- make install
- tar -zxvf nrpe-2.12.tar.gz
- cd nrpe-2.12
- (注:在执行下步之前必须保证这个主机上已经安装了openssl、openssl-devel 否则在编译
- 的时候将提示有不能找到ssl头文件的错误,导致编译无法进行)
- ./configure
- make all
- make install-plugin
- make install-daemon
- make install-daemon-config
4、对nrpe的配置文件/usr/local/nagios/etc/nrpe.cfg进行配置
vim /usr/local/nagios/etc/nrpe.cfg
- allowed_hosts=192.168.0.1 (nagios服务器的IP,即允许这个IP来读取有关数据)
5、检测配置文件的语法并启动服务
到此我们在被监控的linux主机上的配置已经完成
Nagios服务端配置:
1、安装NRPE
- tar xvf nrpe-2.12.tar.gz
- cd nrpe-2.12
- (注:同样,在执行下步之前必须保证这个主机上已经安装了openssl-devel、openssl,否
- 则编译将出错)
- ./configure
- make all
- make install-plugin
2、配置nagios的服务命令文件/var/www/nagios/etc/objects/commands.cfg定义外部构件nrpe
vim /var/www/nagios/etc/objects/commands.cfg
添加如下内容:
- #check nrpe
- define command{
- command_name check_nrpe
- command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
- }
3、由于此服务的配置文件中被没有关于监控linux主机的配置文件,所以我们要自己定义并创建
在/etc/nagios.cfg中定义被监控的linux主机的配置文件的名字及位置
然后我们就要到定义的位置创建这个文件了
vim /var/www/nagios/etc/objects/mylinux.cfg
添加如下内容
- define host{
- use linux-server
- host_name mylinux
- alias mylinux
- address 192.168.0.200(被监控的linux主机的IP,这个是我的)
- }
- define service{
- use generic-service
- host_name mylinux
- service_description check-swap
- check_command check_nrpe!check_swap
- }
- define service{
- use generic-service
- host_name mylinux
- service_description check-load
- check_command check_nrpe!check_load
- }
- define service{
- use generic-service
- host_name mylinux
- service_description check-disk
- check_command check_nrpe!check_had1
- }
- define service{
- use generic-service
- host_name mylinux
- service_description check-users
- check_command check_nrpe!check_users
- }
- define service{
- use generic-service
- host_name mylinux
- service_description otal_procs
- check_command check_nrpe!check_total_procs
- }
保存退出
4、重启nagios服
service ngios restart
5、我们查看nagios是否监控到了mylinux,显示如图:
好了,我们监控其他linux主机已经实现了,关于nagios对其它linux主机的监控配置到此为止
Nagios监控MySQL服务及飞信报警
上面我们进行了相关主机监控的配置,但是我们只能通过查看nagios才能知道我们所监控主机的服务是否在线可用,这和我们在实际应用中的作用还有一定的差距,下面我们就来实现nagios的报警机制,即使我们不查看nagios,只要我们所监控的服务掉线了,nagios就给我们发飞信开提示我们。
我们通过监控本机的mysql服务的在线情况来实现这个实验:
nagios监控mysql服务器:
1、 建立专用数据库:
我们通过让nagios监控mysql服务中的一个特定的数据库的在线状态来实现对mysql服务在线状态的监控,
创建这个数据库,并对其进行相应的配置
- mysql -uroot -p123456
- mysql> create database nagios;
- mysql> grant select on nagios.* to nagios@'%' identified by 'nagios';
- mysql> flush privileges;
继续下面的操作,如果不存在就重新编译安装nagios-plugins,具体方法在上一篇有关nagios的文章中,编译时一定要指明--with-mysql.
/var/www/nagios/libexec/check_mysql -H 192.168.1.200 -u nagios -d nagios -p 123qweasd
Uptime: 970348 Threads: 1 Questions: 684584 Slow queries: 3 Opens: 672 Flush tables: 1 Open tables: 369 Queries per second avg: 0.705
如果输出上面的信息,则表示能够读取nagios这个数据库的状态
- #check mysql
- define command{
- command_name check_mysql
- command_line $USER1$/check_mysql -H $HOSTADDRESS$ -u nagios -d nagios -p nagios
- }
4、定义服务:
在/var/www/nagios/etc/objects/localhost.cfg 中添加如下内容
- define service {
- use local-service
- host_name localhost
- service_description msyql
- check_command check_mysql 监控这个服务的命令
- notifications_enabled 1 对这个服务开启监控
- }
OK,我们可以到nagios的“servers”中查看是否监控到了这个服务,显示如下:
既然当服务掉线的时候要使用飞信报警,接下来就对飞信进行配置,来实现飞信报警机制
准备飞信的客户端和库文件:
1、将飞信的客户端加入到/usr/bin/中,并添加执行权限
2、将飞信的库文件加入到系统的库文件中
3、测试飞信能否成功发送信息
fetion --mobile 15003880800 --pwd 123qweQWE(飞信密码) --to 15003880800(电话号码) --msg-tpye=0 --msg-utf8 $HOSTNAME
如果出现一大片的乱码信息,表示飞信连接成功,这一大片的乱码是飞信的验证码图片,这个验证码图片在图形界面下才能显示出来,只有第一次使用的时候才会用到验证码,这个图片的位置在/usr/bin下,我们输入相应的验证码即可。
测试成功之后,就继续进行
4、修改nagios的报警配置文件/var/www/nagios/etc/objects/ templates.cfg,修改报警机制,将email改成fetion
- define contact{
- name generic-contact (监控及联系方式模版名称,在其他文件中可以引用)
- service_notification_period 24x7 对服务的监控时间段
- host_notification_period 24x7 对主机的监控时间段
- service_notification_options w,u,c,r,f,s 处于这些状态的服务能够触动报警通知
- host_notification_options d,u,r,f,s 处于这些状态的主机能够触动报警通知
- service_notification_commands notify-service-by-fetion 服务通知报警的方式
- host_notification_commands notify-service-by-fetion 主机通知报警的方式
- register 0
- }
- define command{
- command_name notify-service-by-fetion
- command_line /usr/bin/fetion --mobile 15003880800 --pwd 123qweQWE --to 15003880800 --msg-tpye=0 --msg-utf8="$HOSTNAME"
- }(在飞信报警的命令中可以使用变量,这只是最简单的飞信报警命令设定)
6、重启nagios服务
Nagios是一个强大的状态变化监控报警软件,其功能远远大于此,需要各位自己去探索他其他的功能了