目录
- 一、Zabbix
- 优点
- 缺点
- 二、Nagios
- 优点
- 缺点
- 三、Ganglia
- 优点
- 缺点
开源的推荐三个吧:
一、Zabbix
优点
- 支持多平台的企业级分布式开源监控软件;
- 安装部署简单、管理方便;
- 功能强大,监控灵活,可实现复杂多条件告警;
- 多种数据采集插件,灵活集成;
- 自带画图功能,得到的数据可以绘成图形;
- 同时支持调用脚本,很方便;
- 提供多种API接口,定制化最高的监控软件;
- 出现问题时可自动远程执行命令(需对agent设置执行权限);
缺点
- 项目批量修改不方便;
- 社区虽然成熟,但是中文资料相对较少,服务支持有限;
- 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发,难度较大;
- 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐;
- 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;
- 数据报表需要特殊二次开发定义;
二、Nagios
优点
- 自动化运维,出错的服务器、应用和设备会自动重启;
- 配置灵活,监控项目很多,可以自定义shell脚本,通过分布式监控模式,非常适合大型网络;
- 自动日志滚动;
- 支持以冗余方式进行主机监控;
- 在服务事件和主机事件之间良好的相关性;
- 命令重新加载配置文件无需打扰Nagios的运行;
- 报警设置多样性;
缺点
- 很弱的事件控制台;
- 对性能、流量等指标的处理不给力;
- 看不到历史数据,只能看到报警事件,很难追查故障原因;
- 配置复杂,初学者投入的时间、精力比较大;
- 插件的易用性不好;
三、Ganglia
优点
- 适合监控系统性能,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用;
- 支持浏览器方式访问,但不能监控节点硬件技术指标;
- 适合大型集群环境;
- 部署方便,不用逐台机器添加配置;
- 一台服务器能够通过不同的分层管理上万台机器;
- 可以自定义监控项,监控展示有表格和图像两种,支持手机版。
缺点
- 没有内置的消息通知系统;
- 没有报警机制,出现问题不能够及时报警;