什么是Raft算法_随笔

什么是Raft算法

Raft是一个共识算法。比如比特币之类的加密货币，就需要共识算法。Spring Cloud 的注册中心的解决方案 Consul 也用到了Raft 协议。

Raft的核心思想：先到先得，少数服从多数。

只要存在多个副本的问题,就存在保证数据一致性问题，要保证所有的节点达成数据一致性，就必须通过复制的方式。多个节点，就需要选举出一个Leader。

数据一致性需要两个步骤：领导选举，数据复制。

Raft算法的大致步骤

分布式环境中节点状态：Follower、Leader(实线外框)、Candidate(虚线外框)。
一开始所有的节点都是 Follower 状态。如果 Follower 节点连接不到 Leader（Leader挂了),他就会成为 Candidate。Candidate 请求其他节点的投票，其他的节点会投给他。如果他得到了大多数节点的投票，他就成为了主节点。这个过程就叫做 Leader Election。
现在所有的写 *** 作需要在 Leader 节点上发生。Leader 会记录 *** 作日志。没有同步到其他 Follower 节点的日志，状态是 uncommitted。等到超过半数的 Follower 同步了这条记录，日志状态就会变成 committed。Leader 会通知所有的 Follower
日志已经 committed，这个时候所有的节点就达成了一致。这个过程叫 Log Replication。
在 Raft 协议里面，选举的时候有两个超时时间。第一个交 election timeout。也就是说，为了防止同一时间大量节点参与选举，每个节点在变成 Candidate 之前需要随机等待一段时间，时间范围是 150ms and 300ms 之间。第一个变成 Candidate 的节点会先发起投票。他会先投给自己，然后请求其他节点投票。（Request Vote）
如果还没有收到投票结果，又到了超时时间，需要重置超时时间。只要有大部分节点投给了一个节点，他就会变成Leader。
成为 Leader 之后，他会发消息让来同步数据，发消息的间隔是由 heartbeat timeout 来控制的。Followers 会回复同步数据的消息。
只要 Followers 收到了同步数据的消息，代表 Leader 没挂，他们就会清除 heartbeat timeout 的计时。
但是一旦 Followers 在 heart timeout 时间之内没有收到 Append Entries 消息，他就会认为 Leader 挂了，开始让其它节点投票，成为新的 Leader。
必须超过半数以上节点投票，保证只有一个 Leader 被选出来。
10.如果两个 Follower 同时变成了 Candidate，他就会出现分割投票。比如有两个节点同时变成 Candidate，而且各自有一个投票请求先达到了其他的节点。加上他们给自己的投票，每个 Candidate 手上有 2 票。但是，因为他们的 election timeout 不同，在发起新的一轮选举的时候，有一个节点收到了更多的投票，所以它变成了 Leader。

总结

Sentinle 的 Raft 算法和 Raft 有点不同:

master 客观下线触发选举，而不是过了 election timeout 时间开始选举。
Leader 并不会把自己成为 Leader 的消息发送给其他 Sentinel。其他 Sentinel 等待 Leader 从 Slave 选出 master 后，检测到新的 master 正常工作后，就会去掉客观下线的标识，从而不需要进入故障转移流程。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5690132.html

什么是Raft算法

发表评论

评论列表（0条）