架构师成长之路-DNS服务器搭建(构建企业级DNS)
采用LVS-DR模式负载均衡,多IDC,多套DNS集群,通过master-slave技术保证dns配置的一致性。
1.构建高性能、高可用性DNS
物理层:
- 首先确保两台lvs不在同一机柜、同一物理交换机接入;
- 其次确保将所有dns服务器也做到不在同一机柜、同一物理交换机接入。
- 同时,在不同的idc构建多套dns集群,为客户端提供可切换的配置。
服务层:
- 坚决摒弃lvs上端口检测这种方式,采用自定义脚本检测,为dns的健康检测单独设置一个域名,就为了lvs检测dns是否存活而设计。
脚本示例:
客户端层:
- 多idc之间的流量切换是通过客户端的健康检测cron实现的,脚本每分钟运行一次,分别检测每个dns集群虚地址的可用性。
2.构建高可用性DNS
- 通过lvs可以对每个集群做横向扩容,是否需要扩容的依据是对现有系统的压测结果,以及实时的监控数据。
- 亦或者可以在最靠近应用层处,加上一层cache-only集群,但前提是你的线上环境中,没有任何系统依赖于dns负载均衡。
3. 压测
安装queryperf
在相同idc的压测下,单台dns-server的qps可以达到35~40k
4. 监控 可结合zabbix监控
系统基础性能:
- 使用zabbix自带模板即可。Cpu、内存、主机存活、磁盘空间、主机运行时间、系统load
Loopback地址绑定状态监控
- 该架构中,dnsserver在集群中充当realserver的角色,在dr中,需要绑定loopback地址方能通信,因此当loopback地址没有绑定上时,lvs健康检测通过,但是当请求到达dnsserver时,请求被拒绝,dns集群会出现异常。
Dns数据与master一致性监控
此处建议方案是分为两部分:
- 一是通过写zabbix自定义discovery,扫出dns配置中所有zone,然后分别对比slave和master每个zone的serial值,当slave与master的值持续5分钟不一致时报警
- 二是写脚本,每15分钟扫一遍master上所有域名解析结果,与每个slave的结果做对比,当出现结果不一致情况时,报警
Dns响应时间监控
- 远端一组主机跑在fullnat下(提供高可用),通过dig命令检测dnsserver的响应时间。
Dns每秒请求数监控
- 在每台dns主机上,编写zabbix脚本,分析named_stats文件,获取每秒请求数
Dns可用性监控
- 远端一组主机跑在fullnat下(提供高可用),通过host命令检测dnsserver的可用性,脚本与lvs健康检测脚本类似。
.......