有朋友问我,DNS轮询是不是过时的技术了?有了反向代理层(Nginx、LVS、F5等),是不是就不需要DNS轮询了?

然而,反向代理层绝不能替代DNS轮询!

反向代理层有什么用?架构实现时要注意什么?

(1) 作为服务端统一入口,屏蔽后端WEB集群细节,代表整个WEB集群; 画外音:这就是为啥它叫反向代理。 (2) 保证WEB集群的扩展性,Nginx后端可随时加WEB实例; (3) 实施负载均衡,反向代理层会将请求均匀分发给后端WEB集群的每一个实例; (4) 保证WEB集群的高可用,任何一个WEB实例挂了,服务都不受影响; (5) 注意自身高可用,防止一台Nginx挂了,服务端统一入口受影响;

反向代理层还存在啥问题?

反向代理层自身的扩展性问题并没有得到很好的解决,例如当Nginx成为系统瓶颈的时候,无法扩容。

DNS轮询如何解决反向代理层的扩展性问题?

通过在DNS-server上对一个域名设置多个IP解析,能够增加入口Nginx实例个数,起到水平扩容的作用,解决反向代理层的扩展性问题。

因此,反向代理和DNS轮询并不是互斥的技术,however,这里详细展开讲一下接入层的架构渐进历程。

裸奔时代(1)单机架构

裸奔时代的架构图如上: (1) 浏览器通过DNS-server,域名解析到ip; (2) 浏览器通过ip访问web-server;

缺点: (1) 非高可用,web-server挂了整个系统就挂了; (2) 扩展性差,当吞吐量达到web-server上限时,无法扩容; 画外音:单机不涉及负载均衡问题。

简易扩容方案(2)DNS轮询

假设tomcat的吞吐量是1000次每秒,当系统总吞吐量达到3000时,如何扩容是首先要解决的问题,DNS轮询是一个很容易想到的方案。 画外音:DNS轮询解决扩展性问题。 此时的架构图如上: (1) 多部署几份web-server,1个tomcat抗1000,部署3个tomcat就能抗3000; (2) 在DNS-server层面,域名每次解析到不同的ip;

优点: (1) 零成本:在DNS-server上多配几个ip即可,功能也不收费; (2) 部署简单:多部署几个web-server即可,原系统架构不需要做任何改造; (3) 负载均衡:变成了多机,负载也是均衡的;

缺点: (1) 非高可用:DNS-server只负责域名解析ip,这个ip对应的服务是否可用,DNS-server是不保证的,假设有一个web-server挂了,部分服务会受到影响; (2) 扩容非实时:DNS解析有一个生效周期; (3) 暴露了太多的外网ip;

简易扩容方案(3)反向代理Nginx

tomcat的性能较差,但Nginx作为反向代理的性能就强很多,假设线上跑到1w,就比tomcat高了10倍,可以利用这个特性来做扩容。 此时的架构图如上: (1) 站点层与浏览器层之间加入了一个反向代理层,利用高性能的Nginx来做反向代理; (2) Nginx将http请求分发给后端多个web-server;

优点: (1) DNS-server不需要动; (2) 负载均衡:通过Nginx来保证; (3) 只暴露一个外网ip,Nginx->tomcat之间使用内网访问; (4) 扩容实时:Nginx内部可控,随时增加web-server随时实时扩容; (5) 能够保证站点层的可用性:任何一台tomcat挂了,Nginx可以将流量迁移到其他tomcat; 画外音:反向代理,能够更实时,更方便的扩容了。

缺点: (1) 时延增加+架构更复杂了:中间多加了一个反向代理层; (2) 反向代理层成了单点,非高可用:tomcat挂了不影响服务,Nginx挂了怎么办?

高可用方案(4)keepalived

为了解决高可用的问题,keepalived出场了。 (1) 做两台Nginx组成一个集群,分别部署上keepalived,设置成相同的虚IP,保证Nginx的高可用; (2) 当一台Nginx挂了,keepalived能够探测到,并将流量自动迁移到另一台Nginx上,整个过程对调用方透明; 优点: (1) 解决了高可用的问题; 画外音:反向代理的高可用也解决了。

缺点: (1) 资源利用率只有50%; (2) Nginx仍然是接入单点,如果接入吞吐量超过的Nginx的性能上限怎么办,例如qps达到了50000咧?

scale up扩容方案(5)lvs/f5

Nginx是应用软件,性能比tomcat好,但总有个上限,超出了上限,还是扛不住。

lvs就不一样了,它实施在操作系统层面;f5的性能又更好了,它实施在硬件层面;它们性能比Nginx好很多,例如每秒可以抗10w,这样可以利用他们来扩容,常见的架构图如下: (1) 如果通过Nginx可以扩展多个tomcat一样,可以通过lvs来扩展多个Nginx; (2) 通过keepalived+VIP的方案可以保证可用性;

99.9999%的公司到这一步基本就结束了,解决了接入层高可用、扩展性、负载均衡的问题。 画外音:上游再加一层扩充性能。

完美了嘛,还有什么潜在问题? 好吧,不管是使用lvs还是f5,这些都是scale up的方案,根本上,lvs/f5还是会有性能上限,假设每秒能处理10w的请求,一天也只能处理80亿的请求(10w秒吞吐量*8w秒),那万一系统的日PV超过80亿怎么办呢?

scale out扩容方案(6)DNS轮询

如之前文章所述,水平扩展,才是解决性能问题的根本方案,能够通过加机器扩充性能的方案才具备最好的扩展性。

facebook,google,baidu的PV是不是超过80亿呢,它们的域名只对应一个ip么,终点又是起点,还是得通过DNS轮询来进行扩容。 画外音:DNS轮询解决扩展性问题。 (1) 通过DNS轮询来线性扩展入口lvs层的性能; (2) 通过keepalived来保证高可用; (3) 通过lvs来扩展多个Nginx; (4) 通过Nginx来做负载均衡,业务七层路由;

总结

稍微做一个简要的总结: (1) 接入层架构要考虑的问题域为:高可用、扩展性、反向代理、负载均衡; (2) Nginx、keepalived、lvs、f5可以很好的解决高可用、扩展性、反向代理、负载均衡的问题; (3) 水平扩展scale out是解决扩展性问题的根本方案,DNS轮询是不能完全被Nginx/lvs/f5所替代的;

希望大家有收获。 架构师之路-分享可落地的技术文章

相关推荐: 《负载均衡,必须要知道的5件事》 《微服务,到底解决什么问题》 《容量设计,是架构师最基本的基本功》

讨论:你家的接入层技术,在哪个时代?