The Future of Monitoring
通信行业案例分享
Zabbix at GTD Group
“作为智利最领先的通信服务提供商,我们的核心理念是灵活、可靠、以客户为本,时刻响应客户的需求,提升客户的体验。 尤其是我们网络、电话服务、电视通讯服务部分的容错率非常低,我们要实时确保服务的可获取性和稳定性。这也是我们为什么选择Zabbix的原因” – Joel Urtubia Ugarte,GTD集团高级网络智能工程师。
一 GTD集团目前服务于:
250000+ 网络客户
160000+ 付费电视客户
250000+ 电话服务客户
一 项目目标:
GTD集团需要一套可扩展的、开箱即用的监控解决方案来监控他们所有的基础设施,同时也需要有可靠的社区和商业服务的支持。
一 客户要求:
考虑到超大规模的客户数量,集团需要在他们网络上监控一系列不同的设备。由于大部分设备都支持SNMP,所以通过Zabbix来监控是非常简单的。另外,他们非常看重历史数据的保存和有效管理,所以进一步提出了更快的数据库引擎的需求,比如Elasticsearch和强大的API的使用等。
一 实施情况:
之前使用的是Cacti 和 HP OpenView (现在的HP BTO Software), 相比之下,明显的区别是Zabbix实际配置和设置过程中的易用性,部分要归功于Zabbix产品本身内嵌的一些功能和产品操作手册,同时GTD集团内部也有一位有一定Zabbix使用经验的工程师Ciro Vera。
据高级网络工程师Joel Urtubia Ugarte说,他们在使用过程中遇到的唯一挑战是,当Zabbix server的量级大到一定程度需要进行性能调优时,工程师们在学习上好像要花很多时间,幸运的是,通过ZCS(Zabbix Certified Specialist)和ZCP(Certified Professional)课程5天的学习,这个问题迎刃而解。
一 业务成效:
“Zabbix最棒的功能就是——可以监控任何设备” – Joel Urtubia Ugarte,GTD集团高级网络智能工程师
- 实现了网络和客户终端设备的可视化监控,可以在最终客户之前洞察存在的隐患,并且采取行动,避免损失
- 可以开箱即监控几乎所有的网络设备,并且生成可视化的图表和地图(graphs and maps)
- 灵活的触发器设置机制,可以依据故障根因分析设置
- 提升监控的整体性能和稳定性
- 跟之前的解决工具相比,大大降低了TCO成本
自从2010年开始配置和使用Zabbix之后,由工程师Ciro Vera领导的运维团队可以非常轻松的监控超过十万台设备,且仅仅只使用了一个Zabbix server,进而保障对客户的服务质量。
一 Zabbix规模数据:
架构: 1 Zabbix server + Elastisearch (for DB)
hosts数量: ~120’000
items数量: ~630’000
triggers数量: ~320’000
NVPS: ~4’500
参加官方认证培训,了解更多Zabbix最新信息:
点击查看培训介绍
ZCU 2019年7月26,远程在线培训(报名中)
ZCS+ZCP; 2019年8月12-16,广州(报名中)
ZCU; 2019年8月23,远程在线培训(报名中)
ZCS+ZCP; 2019年9月23-27,上海(报名中)