目录

第1章 监控那些事... 3

1.1我的监控之旅... 3

1.2监控的分类... 6

1.3有效监控... 6

1.4经验之谈... 7

第2章 认识开源分布式监控平台Centreon. 8

2.1 Centreon主要特征... 9

2.2 Centreon主要组成部分... 12

2.2.1操作系统CentOS. 12

2.2.2数据库MySQL. 12

2.2.3 WEB服务器Apache. 12

2.2.4 应用服务PHP. 14

2.2.5 Centreon相关组件... 14

2.2.6 Centreon分布式监控架构... 16

2.3 Centreon WEB 管理界面简述... 17

第3章 安装部署Centreon 20.10. 21

3.1 安装部署需求... 21

3.2安装前的准备工作... 23

3.3以Centreon ISO进行安装... 24

3.4在操作系统CentOS 7上安装Centreon. 35

3.4.1安装Centreon 先决条件... 36

3.4.2准备Yum安装源... 37

3.4.3安装Centreon Central Server 37

3.4.4修改数据库LimitNOFILE限制(可选)... 38

3.4.5修改PHP时区... 39

3.4.6将所有相关服务设置成随系统开机启动... 39

3.4.7启动所有服务... 40

3.5验证Centreon 安装的正确性... 40

第4章 更进一步了解Centreon. 41

4.1 Centreon初始化设置... 41

4.2 Centreon 20 相关信息初探... 46

4.2.1 Centreon相关性账号... 46

4.2.2主要配置文件... 48

4.3 Web管理后台登录... 54

4.4 注意事项... 55

第5章 我们的第一个监控... 56

5.1添加主机... 56

5.2添加依附于主机的服务... 62

5.3导出数据并启动Centreon引擎... 64

5.4操作步骤汇总... 70

5.5验证监控有效性... 70

第6章 玩真的,监控生产环境(一)... 72

6.1确定监控范围... 72

6.2告警工具准备... 72

6.3钉钉告警... 72

6.3.1准备钉钉群组机器人... 73

6.3.2告警整合进Centreon. 80

6.4短信告警... 85

6.5邮件告警... 86

第7章 玩真的,监控生产环境(二)... 88

7.1监控主机资源... 88

7.1.1安装NRPE. 89

7.1.2安装Nagios插件... 90

7.1.3被监控端配置NRPE. 90

7.1.4验证NRPE. 93

7.1.5监控服务器Centreon Central添加主机资源监控项... 94

7.1.6主机资源监控验证... 98

7.2模拟故障告警... 100

7.3批量部署NRPE监控主机资源... 104

第8章 玩真的,监控生产环境(三)... 107

8.1监控服务... 107

8.1.1监控负载均衡(Keepalived + HAProxy)... 108

8.1.2监控Proxmox VE超融合集群... 111

8.2监控小型站点... 114

8.2.1监控Nginx服务... 115

8.2.2监控PHP服务... 116

8.2.3监控MySQL数据库... 117

8.2.4综合性监控... 122

第9章Centreon 日常管理及维护... 125

9.1 Centreon 日常维护... 125

9.1.1 Centreon相关服务的启停... 125

9.1.2 Centreon数据备份... 126

9.1.3 Centreon 故障处理... 128

9.2 Centreon Central日常管理... 130

9.2.1添加联系人/用户... 130

9.2.2删除被监控主机... 139

9.2.3删除联系人/用户... 140

9.3 Nagios插件脚本撰写... 140

9.3.1监控日志文件是否生成(check_logfile)... 141

9.3.2监控日志文件大小(check_logsize)... 141

9.4 Centreon Central告警静默... 143

9.4.1立刻保持静默... 143

9.4.2固定时间静默... 145

第10章 Centreon使用技巧... 147

10.1创建Centreon 模板... 147

10.1.1创建服务模板... 148

10.2自定义Centreon Central管理后台视图( Custom Views)... 153

10.3复制监控对象... 156

10.4多用户钉钉机器人报警... 157

10.4.1创建钉钉群组... 158

10.4.2创建自定义钉钉群组机器人... 158

10.4.3创建另一个钉钉机器人调用脚本... 159

10.4.4 Centreon Web管理后台创建通知命令... 160

10.4.5创建联系人并关联钉钉... 162

10.4.6联系人/用户附属到主机或者服务... 163

 

11 Centreon版本升级

11.1 Centreon小版本升级.............................................................................. 166

11.1.1更新Centreon YUM源................................................................ 166

11.1.2 Centreon 在线更新...................................................................... 167

11.1.3重启PHP及Apache服务........................................................... 168

11.1.4 Centreon管理后台更新.............................................................. 169

11.1.5重启其它相关服务........................................................................ 172

11.2 Centreon 大版本升级............................................................................. 173

11.2.1更新系统及Centreon YUM源................................................... 173

11.2.2 Centreon 更新.............................................................................. 173

11.2.3启动新的PHP 7.2......................................................................... 174

11.2.4验证升级是否正常........................................................................ 177

11.3 Centreon版本升级的变化...................................................................... 178

第12章 Centreon 分布式监控............................................................................. 180

12.1安装Centreon 分布式Poller................................................................. 180

12.2中央服务器添加Poller............................................................................ 182

12.2.1以SSH协议连接远端Poller....................................................... 183

12.2.2以“gorgone”协议连接远端Poller.............................................. 186

12.3通过远端Poller监控私有网络............................................................... 189

12.3.1需求及场景描述............................................................................ 189

12.3.2添加受保护的内网主机............................................................... 190

12.3.3添加主机服务项............................................................................ 190

12.3.4模拟故障,验证监控是否有效................................................... 192

第13章 Centreon备份与恢复.............................................................................. 194

13.1最快的备份及恢复................................................................................... 195

13.1.1 Centreon系统备份....................................................................... 195

13.1.2 Centreon系统快速恢复.............................................................. 197

13.2简化性的Centreon备份及恢复............................................................ 200

13.2.1备份MariaDB数据库................................................................... 201

13.2.2备份非数据库文件........................................................................ 201

13.2.3 Centreon中央监控服务器恢复.................................................. 201

13.3经验总结.................................................................................................... 203

第14章 Centreon 典型故障处理......................................................................... 205

14.1远端Poller故障........................................................................................ 205

14.2 Centreon Central中央监控服务器故障............................................... 208

14.2.1 Centreon Central Web管理后台不能登录.............................. 209

14.2.2 “cdb”服务不能启动............................................................................... 210

14.2.3 Centreon Poller 间隙性停止故障.............................................. 211

14.3 NRPE(Nagios Remote Plugin Executor)故障................................. 215

14.3.1普通账号权限问题........................................................................ 215

14.3.2远端Poller内的NRPE权限问题............................................... 217

第15章 杂项............................................................................................................ 219

15.1 Centreon 高可用性(HA)................................................................... 219

15.2监控更大规模的网络............................................................................... 221

15.3 Centreon 的安全性................................................................................. 221

 

全文完