随着信息的快速发展,分布式系统变得越来越重要,大型的网站系统无不都是分布式的架构,而理解CAP则是理解分布式的基础。1998年,一位计算机科学家Eric Brewer提出,分布式系统有三个指标:Consistency、Availability、Partition tolerance。
Consistency:一致性,对于分布式系统的所有结点,能够时刻保持数据的一致性
Availability:可用性,系统能够保证7*24小时稳定且持续提供对外服务
Partition tolerance:分区容错性,系统在遇到网络分区故障的时候,仍然能够保证对外提供服务
理论上,只要系统在设计上满足这三点的特性即保证系统高性能、高可用和高稳定性,便可无限扩展,但Eric Brewer也表明了这三点是不可同时满足的,最多只能实现其中的两点,通常我们会在CP和AP之间进行选择。
CP模型:
对于分布式系统,一个功能都会有多台服务器对外提供服务。保证系统的数据的一致性和分区容错性,需要实时同步服务器之间的数据,保证数据之间的高度同步,而服务器同步数据则会断开对外提供服务,因此势必会影响到系统的可用性。
AP模型:
保证数据的分区容错性和可用性,则需减少结点之间数据的同步,允许系统结点之间存在一定的数据误差,时刻保证对外提供服务的。相比CP模型,不会在同一时刻所有结点的数据一致,一般采用写入到一个主结点,再逐渐同步到所有结点。
AC模板:
抛弃系统的分区容错性,只采用一个结点进行部署,生产环境中这种做法是很危险,可不考虑。
合适的选型最终还是要依赖于业务的实际场景。比如注册中心的选择,做社区类型的允许数据存在可接受的误差,那就可以选择AP模板Eureka,而像涉及金钱的业务,则需要时刻保证数据的高度一致,可选择CP模型的zookeeper,所以还是要以业务场景为依据。