1.ZooKeeper是什么
ZooKeeper为分布式应用提供了高效且可靠的分布式协调服务,提供了统一命名服务、 配置管理和分布式锁等分布式的基础服务。在解决分布式数据一致性方面, ZooKeeper采用的是 ZAB (ZooKeeperAtomic Broadcast)的一致性协议。
ZooKeeper是一个典型的分布式数据一致性的解决方案, 分布式应用程序可以基于它实现现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、 Maste选举、 分布式锁和分布式队列等功能。
ZooKeeper可以保证如下分布式一致性特性:
1.顺序一致性:从同一个客户端发起的事务请求, 最终将会严格地按照其发起顺序被应用到Zookeeper中去。
2.原子性:所有事务请求的处理结果在整个集群中所有机器上的应用情况是一致的。
3.单一视图( Sing1eSvsfem/mage):无论客户端连接的是哪个 ZooKeeper服务器,其看到的服务端数据模型都是一致的 。
4.实时性:ZooKeeper仅仅保证在一定的时间段内, 客户端最终一定能够从服务端上读取到最新的数据状态。
2.ZooKeeper的设计目标
目标一 : 简单的数据模型
Zookeeper使得分布式程序能够通过一个共享的、树形结构的名字空间来进行相互协调。由一系列的被称为ZNODE的数据节点构成。类似于文件系统,但是Zookeeper将全部数据都存放在内存中,以提高服务器吞吐,减少延迟。
目标二:构建集群
组成 ZooKeeper集群的每台机器都会在内存中维护当前的服务器状态, 并且每台机器之间都互相保持着通信。只要集群中存在超过一半的机器能够正常工作,那么整个集群就能够正常对外服务。ZooKeeper的客户端程序会选择和集群中任意一台机器共同来创建一个 TcP连接,当客户端和某台 ZooKeeper服务器之间的连接断开后, 客户端会自动连接到集群中的其他机器。
目标三:顺序访问
对于来自客户端的每个更新请求,zookeeper会分配一个全局唯一的递增编号,这个编号反应了所有事务的操作先后顺序。
目标四:高性能
ZooKeeper将全量数据存储在内存中,并直接服务于客户端的所有非事务请求,适用于以读操作为主的应用场景。
3.ZooKeeper的基本概念
集群
在分布式系统中, 典型的集群模式是 Master/Slave模式(主备模式)。能够处理所有写操作的机器称为 Master机器, 把所有通过异步复制方式获取最新数据, 并提供读服务的机器称为Slave机器。
Zookeeper没有沿用Master/Slave概念,引入了Leader、 Follower和 Observer三种角色。ZooKeeper集群中的所有机器通过fastLeader选举算法选定一台Leader,Leader服务器为客户端提供读和写服务。除 Leader外,其他机器包括 Follower和 〇bserver。 Follower和 Observer都能够提供读服务,唯一的区别在于, Observer机器不参与 Leader选举过程,也不参与写操作的“过半写成功”策略,因此 Observer可以在不影响写性能的情况下提升集群的读性能。
会话(Session)
zooKeeper中, 一个客户端连接是指客户端和服务器之间的一个 TCP长连接。 ZooKeeper对外的服务端口默认是2181 ,客户端启动的时候,首先会与服务器建立一个 TCP连接, 通过这个连接, 客户端能够通过心跳检测与服务器保持有效的会话, 也能够向 ZooKeeper服务器发送请求,接受响应,同时还能够通过该连接接收来自服务器的 Watch事件通知。Session的 sessionTimeout值用来设置一个客户端会话的超时时间。 当由于服务器压力太大、 网络故障或是客户端主动断开连接等各种原因导致客户端连接断开时, 只要在 sessionTimeout规定的时间内能够重新连接上集群中任意一台服务器,那么之前创建的会话仍然有效。
数据节点(Znode)
ZooKeeper中,节点分为两类,第一类为机器节点,指构成集群的机器;第二类为数据节点ZNode。ZNode可以分为持久节点和临时节点两类。
持久节点是指除非主动进行 ZNode的移除操作, 否则这个 ZNode将一直保存在ZooKeeper上。
临时节点的生命周期和客户端会话绑定, 一旦客户端会话失效, 这个客户端创建的所有临时节点都会被移除。
版本
对应于每个 ZNode,ZooKeeper都会为其维护一个叫作 Stat的数据结构, Stat中记录了这个 ZNode的三个数据版本,分别是 version(当前 ZNode的版本)、 cversion(当前ZNode子节点的版本)和 aversion(当前 ZNode的 ACL版本)。
Watcher
用户可以在指定节点上注册一些 watcher,井且在一些特定事件触发的时候, ZooKeePer服务端会将事件通知到感兴趣的客户端上去。
ACL
ZooKeeper定义了如下5种权限:
CREATE:创建子节点的权限。
READ: 获取节点数据和子节点列表的权限。
WRITE:更新节点数据的权限。
DELETE:删除子节点的权限。
ADMIN:设置节点 ACL的权限。
此处注意,CREATE和 DELETE这两种权限都是针对子节点的权限控制。对一个会话赋予/a节点的delete权限时,此会话拥有删除/a的子节点的权限,而不是删除/a节点的权限。