-
一直在使用nagios做系统的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。1.调整external_command_buffer_slotsnagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。2.避免servicegroup,hos
-
最近经常遇到nagios频繁报警头痛,听说可以尝试自动设置自动报警间隔时间,于是自己测试了可以
vim nagios.cfg
插入一句
cfg_file=/usr/local/nagios/etc/objects/escalations.cfg
vim /usr/local/nagios/etc/objects/escalations.cfg
添加如下内容
define ho
-
环境:
Centos5.6 mysql只做同步指定库,没有同步mysql库用户数据
登陆从服务器mysql,添加验证的用户
grant replication client on *.* to 'nagios'@localhost identified by '123456';
flush privileges;
查看是否添加成功
selec
-
一、软件环境(centos 5为例)这里向大家推荐的是飞信机器人的软件,支持linux、命令行下的飞信、完全免费(目前为止);官网地址:[url]http://www.it-adv.net/[/url]支持库安装:需要Glibc2.4以上的版本;centos5默认安装的Glibc2.5,所不需要额外升级;目前网上的安装文档只有ubuntu的,至于redhat、fedora、centos都没有相关安
-
一、Nagios 简单原理:
Nagios 简单地说就是一个平台,其工作都依赖于插件及第三方工具来实现。像plgins 可以检测到服务(pop2,tcp,httpd,mysql等)的状态; nrpe可以检测到主机本身信息(swap,sdx,top等)的状态; nsca可以检测到windows机器的状态。报警(常用):邮件―sendmail;msn-sendmsg;短信-短信网关/飞信。还可以结合
-
四.如何监控windows系统的”本地信息”
在nagios2.x系列里面,文档里面对于windows服务器的监控相关说明较少,刚到nagios主页上看到3.x的文档里面有一篇讲监控windows的([url]http://nagios.sourceforge.net/docs/3_0/monitoring-windows.html[/url]
),我就仿照过来,对它略作修
-
四. 使用NRPE监控LINUX上的”本地信息”
本部分主要参考了NRPE的官方手册
本节的目的,对系统为linux的主机dbpi进行如下监控:CPU负载,磁盘容量,登陆用户数,总进程数,僵尸进程数,swap分区使用情况
书接前文,对于像磁盘容量,cpu负载这样的”本地信息”,nagios只能监测自己所在的主机,
-
三. 使用命令和插件监控更多信息
个人觉得这里是全篇文章里面最难理解的部分,我也将尽力解释清楚.还是那句话,原理了解了什么就都简单了.
在上篇文章里面,我们已经增加了三个监控项目,分别监控nagios-server,dbpi,yahoon这三台主机是否存活.现在我对这三台机器分别做了如下设置
开放nagios-server的ftp
开放dbpi的ssh
开放yahoon的
-
注:
本部分参考了官方文档和田逸的文章<<看我出招之:我用Nagios(技术细节)>>来修改完成.
4.典型配置
之前已经说过nagios要用起来,就必须修改配置文件,增加要监控的主机和服务才行.在具体做这个动作之前,下面的概念必须要了解.
1)预备知识
Nagios自己定义了一套规则用于配置文件,其中最重要的概念就是
-
二. 基本安装和配置
本部分主要参考官方文档和田逸的文章<<看我出招之:我用Nagios(技术细节)>>来修改完成.
最后达到如下的功能
监控机自身的信息,包括主机信息以及对外提供的服务
被监控机对外提供的服务
如下所有的操作都在监控机192.168.0.111上进行
1.安装nagios主程序
解压缩
tar -zxvf nagios-2.
-
一. 准备阶段:
1.实验环境
包含3台主机,详细信息如下
主机名
操作系统
IP
作用
nagios-server
redhat 9
192.168.0.111
监控机
dbpi
redhat 9
192.168.0.100
被监控机
yahoon
xp
192.168.0.28