Zookeeper分布式过程协同技术 - 概念及基础 Zookeeper是什么?
Zookeeper是一种分布式过程协同技术,其所提供的客户端API功能强大,其中包括:
保障强一致性。有序性和持久性。
实现通用的同步原语的能力。
在实际分布式系统中,并发往往导致不正确的行为。Zookeeper提供了一种简单的并发处理机制。
关于Zookeeper名字的来源
Zookeeper由雅虎研究院开发,开发团队原来想使用动物命名项目,在讨论时大家觉得分布式系统就像一个动物园,胡乱且难以管理,而Zookeeper就是将这一切变得可控。遂起名为Zookeeper,意为动物园管理员。
Zookeeper使用场景命名服务
命名服务是指通过路径名称来获取服务的地址。首先zookeeper创建一个全局路径,服务方在全局路径下写入服务的地址(或者名称),服务消费方在启动后watch全局路径的数据和变化。注意,这里的节点均为临时节点,在服务连接中断或者宕机时,通过临时节点消失能够通知订阅方感知变化。
配置管理
服务分布部署在不同的机器上,将全局的配置信息存放于zookeeper的节点下,客户端通过订阅节点的数据变化获取到配置信息。当节点中的配置信息发生变化时,客户端可以通过watch节点发送的消息感知,从而修改服务本地的配置管理信息。
集群管理
当有新机器加入集群时,由新机器的客户端在指定的目录下新建临时节点,服务注册管理端通过订阅指定目录的变化,收到了新增节点的通知后,将新机器加入集群服务的列表。当机器退出集群或者宕机时,临时节点将会被删除,同样可以通知服务注册管理端,有机器退出了集群。
分布式锁
zookeeper的分布式锁可以分为2种,保持独占或者控制时序。
对于保持独占来说,可以把一个节点看做是一把锁,通过创建节点的方式来抢占锁资源。如果创建节点成功,客户端也就持有了这把锁,如果创建失败,则订阅节点的变化,如果收到节点删除消息,再次尝试创建节点来抢占锁资源。
对于控制时序来说,通过在指定目录下创建临时有序节点,编号最小的节点首先持有锁资源,每个后续节点都订阅前一个节点。拥有锁资源的客户端在操作完毕后,删除自己创建的节点。后续节点收到前置节点的删除通知后,即获取了锁资源,可以进行业务操作。
Zookeeper基础Zookeeper通过节点(znode)来实现原语的功能,并不直接暴露原语。Znode指Zookeeper操作和维护一个小型的数据节点,类似于文件系统的层级树状结构进行管理。
图:Zookeeper数据结构示例
· /作为跟目录节点,根节点下有/workers和/tasks两个字节点。
· /workers节点作为父节点,其下的每一个znode子节点用于保存系统中的可用worker,节点中保存着worker子节点的元数据信息。
· /tasks节点作为父节点,其下每个znode子节点用于保存一个代执行的任务,节点中保存着任务的详细数据。
API概念ZookeeperAPI提供了以下方法来实现地znode的控制。
create /path data
创建一个名为/path的znode节点,并包含数据data。
delete /path
删除名为/path的znode。
exists /path
检查是否存在名为/path的节点。
setData /path data
设置名为/path的znode节点的数据为data。
getData /path
返回名为/path节点的数据信息。
getChildren /path
返回所有/path节点的所有子节点列表。
Znode类型在新建znode时,需要指定该节点类型,不同的类型决定了znode节点的行为方式,Zookeeper提供了4种不同的znode类型。
持久节点和临时节点
znode节点可以是持久(persistent)节点,还可以是临时(ephemeral)节点。持久的znode,如/path,只能通过delete来进行删除。临时的znode与之相反,当创建的客户端崩溃或者关闭了与Zookeeper的连接时,这个节点就会被删除。