Zookeeper一致性算法原理！

月伴飞鱼2025-09-012025-09-01

ZooKeeper为了保证分布式系统的数据一致性。

无论是处理来自客户端的会话请求时，还是集群 Leader 节点发生重新选举时。

都会产生数据不一致的情况。

为了解决这个问题，ZooKeeper 采用了 ZAB 协议算法。

ZAB 协议算法（原子广播协议）是用来解决集群最终一致性问题的算法。

包括崩溃恢复和原子广播协议。

操作过程:

当 ZooKeeper 集群接收到来自客户端的事务性的会话请求后。

集群中的其他 Follow 角色服务器会将该请求转发给 Leader 角色服务器进行处理。

当 Leader 节点服务器在处理完该条会话请求后。

会将结果通过操作日志的方式同步给集群中的 Follow 角色服务器。

然后 Follow 角色服务器根据接收到的操作日志，在本地执行相关的数据处理操作。

崩溃恢复:

触发 ZooKeeper 集群执行崩溃恢复的事件是集群中的 Leader 节点服务器发生了异常而无法工作。

于是 Follow 服务器会通过投票来决定是否选出新的 Leader 节点服务器。

投票过程如下:

当崩溃恢复机制开始的时候，整个 ZooKeeper 集群的每台 Follow 服务器会发起投票。

并同步给集群中的其他 Follow 服务器。

在接收到来自集群中的其他 Follow 服务器的投票信息后。

集群中的每个 Follow 服务器都会与自身的投票信息进行对比。

如果判断新的投票信息更合适，则采用新的投票信息作为自己的投票信息。

在集群中的投票信息还没有达到超过半数原则的情况下，再进行新一轮的投票。

最终当整个 ZooKeeper 集群中的 Follow 服务器超过半数投出的结果相同的时候。

就会产生新的 Leader 服务器。

选票结构:

logicClock：

用来记录服务器的投票轮次。

logicClock 会从 1 开始计数，每当该台服务经过一轮投票后。

logicClock 的数值就会加 1 。

state：

用来标记当前服务器的状态。

在 ZooKeeper 集群中一台服务器：

具有 LOOKING、FOLLOWING、LEADERING、OBSERVING 这四种状态。

self_id：

用来表示当前服务器的 ID 信息。

该字段在 ZooKeeper 集群中主要用来作为服务器的身份标识符。

self_zxid：

当前服务器上所保存的数据的最大事务 ID ，从 0 开始计数。

vote_id：

投票要被推举的服务器的唯一 ID 。

vote_zxid：

被推举的服务器上所保存的数据的最大事务 ID，从 0 开始计数。

选票筛选：

Follow 服务器进行选票对比的过程：

首先，会对比 logicClock 服务器的投票轮次。

当 logicClock 相同时，表明两张选票处于相同的投票阶段。

并进入下一阶段，否则跳过。

再对比 vote_zxid 被选举的服务器 ID 信息。

若接收到的外部投票信息中的 vote_zxid 字段较大。

则将自己的票中的 vote_zxid 与 vote_myid ：

更新为收到的票中的 vote_zxid 与 vote_myid ，并广播出去。

对比的结果相同，则继续对比 vote_myid 被选举服务器上所保存的最大事务 ID。

若外部投票的 vote_myid 比较大，则将自己的票中的 vote_myid 更新为收到的票中的 vote_myid 。

经过这些对比和替换后，最终该台 Follow 服务器会产生新的投票信息。

并在下一轮的投票中发送到 ZooKeeper 集群中。

消息广播：

在 Leader 节点服务器处理请求后。

需要通知集群中的其他角色服务器进行数据同步。

ZooKeeper 集群采用消息广播的方式发送通知。

ZooKeeper 集群使用原子广播协议进行消息发送。