Zookeeper分布式过程协同技术 - 群首选举 群首概念
群首为集群中服务器选择出来的一个服务器,并被集群认可。设置群首目的在与对客户端所发起的状态变更请求进行排序,包括:create、setData、delete操作。群首将每一个请求转换为一个事务并将事务发送给追随者,确保集群按照群首确定的顺序接受并处理这些事务。
Zookeeper事务Zookeeper服务器会在本地处理只读请求(例如:exists、getData、getChildren)。如果一台服务器接收到客户端的getData请求,服务器读取该状态信息,并将这些信息返回客户端。由于服务器在本地处理读请求,所以在处理以只读请求为主要负载时,性能会比较高。
那些会改变状态的客户端请求(create、delete、setData)将会被转发给群首,由群首执行相应的请求,完成状态的更新,这就是Zookeeper的事务。
选举过程每个服务器启动后进入LOOKING状态,服务器之间进行通信来选举一个群首,通过信息交换对群首选举达成共识。在本次选举中胜出的服务器将进入LEADING状态,而集群中其他服务器将进入FOLLOWING状态。
群首选举消息(leader election notifications)或简单的称为通知。当一个服务器进入LOOKING状态就会向集群中的每一个服务器发送一个通知消息。消息中包含该服务器的投票信息。
投票信息包含服务器标识符(sid)和最近执行的事务的zxid信息,例如投票信息(1,5)代表机器ID为1,最近执行的事务zxid为5。
zxid为一个long型(64位)整数,分为2部分:时间戳部分和计数器部分,每个部分为32位。
当一个服务器收到一个投票信息,该服务器将会根据以下规则修改自己的投票信息:
将接受的voteId和voteZxid作为一个标识符,并获取接收方当前的投票中的zxid,用myZxid和mySid表示接收方服务器自己的值。
如果(voteZxid > myZxid)或者(voteZxid = myZxid 且 voteId > mySid),保留当前的投票信息。
否则,修改自己的投票信息,将voteZxid赋值给myZxid,将voteId赋值给mySid。
当一个服务器收到的仲裁数量的服务器发来的投票信息都一样时,就表示群首选举成功,如果被选举的群首为某个服务器自己,该服务器将会开始行使群首角色,否则就会成为一个追随者并尝试连接被选举的群首服务器。一旦连接成功,追随者和群首之间将会进行状态同步,在同步完成后,追随者才可以处理新的请求。
通过例子来演示选举过程,三台服务器在分别发送出不同的选举投票信息,其投票值包含服务器的标识符和最新的zxid。每个服务器都会收到另外两个服务器发送的投票信息,在第一轮之后,服务器S2和S3将会改变其投票信息为(1,6),之后服务器S2和S3在改变投票信息之后会发送新的通知消息,S1服务器在接收到仲裁数量的通知消息拥有一样的投票信息,最后S1被选举出为集群的群首。