【HBZ分享】Kafka的Consumer消费者机制与分区策略讲解与 Rebalance重平衡，通俗易懂_随笔

【HBZ分享】Kafka的Consumer 消费者机制与分区策略讲解与 Rebalance重平衡，通俗易懂消费者根据什么模式从Broker获取数据？

Kafka集群搭建并整合springboot.
Kafka日志存储流程和LOG日志解析 + LEO + HW 讲解【点击这里】.
Kafka数据文件存储-可靠性保证ACK-ISR核心【点击这里】.
Kafka中日志清理策略.
Kafka高性能之零拷贝原理.

消息是Broker主动push 还是 Consumer去pull的？
答：是Consumer去pull的

Kafka为什么设计成Consumer去pull拉取，而不是broker主动push？

一个Topic分区那么多，那么消费者从哪个分区进行消费？

一个topic有多个分区，每个消费者组又有多个Consumer，那是怎么分配的？

一个topic可以有很多个Consumer来消费，因为该topic中可以有很多个partition分区(leader分区)一个partition分区里的leader，只能由消费者组中的某一个Consumer来进行消费，不同组的Consumer可以同时消费一个partition

Consumer是如何被分配到某个partiton分区中的消费消息？

round-robin(RoundRobinAssignor非默认策略) 轮询

监听

大家到这里是不是很懵圈，明明和topic没关系，为啥又牵扯到订阅topic要一样才行，下面用图+解释告诉更清楚地展示

理想状态的round-robin分配，即组内所有消费者监听的topic完全一致

弊端：非理想状态的分配，即组内每个消费者监听的topic都不同
consumer1只监听topic1
consumer2监听topic1,topic2
consumer3监听topic1,topic2,topic3

造成如上不均衡分配的原因：topic1由于被所有consumer监听，所以topic1是正常的轮询平均分配给每个consumer。 topic2由于只有consumer2,consumer3监听，consumer1并没有监听topic2，所以partition4,partition5只能在consumer2,consumer3这俩之间进行轮询。而topic3只有consumer3监听，随意topic3的所有partiton全部归consumer3消费，这样会导致consumer3的压力巨大，非常不均衡。这就是round-robin策略的弊端

range(RangeAssignor默认策略) 范围

【按照主题topic进行分配】每个主题topic会把它里面的partiton平均分配给监听他的consumer，缺点就是如果监听topic有2个consumer，但是topic中有5个partiton，那么第一个consumer1会多监听一partition即监听3个。如果有大量的这种topic，那不均衡现象就会明显。如何

上图可见，一共8个分区，consumer1却监听了5个，因为range策略是按照topic来看的，所以topic之间的partition是相互独立的，即先把topic1的3个partition平均分给2个consumer，再把topic2的两个partition平均分给2个consumer，最后再把topic3的3个partiton平均分给2个consumer。所以不要看成8个partiton分给两个consumer，要以3个，2个，3个partiton的角度分别平均分配给2个consumer，这就是range的策略

Kafka的重平衡

什么是Reblance *** 作

kafka均匀的分配某个topic下所有的partition到各个消费者，从而使得消息的消费速度达到最快，这就是平衡。而rebalance（重平衡）其实就是重新进行partition分配，从而使得partiton的分配重新达到平衡

哪些 *** 作或变化能触发rebalance重平衡？

当消费者consumer数量发生变化时会触发重平衡：比如启动10消费者时，由于10个消费者不可能同时启动完成，当启动完第一个consumer时分给了该消费者20个partition，当第二个consumer启动好了的时候，就会触发重平衡，使得每个consumer监听10个partition，随着更多得consumer启动成功，会不断地重平衡，均匀得分配到各个consumer当分区partition数量发生变化时：比如kafka的某个节点突然挂了，导致该节点的topic都不可用，从而导致大量的partition无法被消费，此时会触发重平衡。或者由于线上压力比较大，有创建了新partition进行缓解压力，此时也会触发重平衡。

当consumer从宕机中恢复过来了，又是如何接着消费的呢？

消费者consumer会记录offset，当恢复后会接着从offset记录的位置开始消费

offset保存在哪里？又是怎么样去保存的？

名称是_consumer_offsets

key = 消费者所在组名 + 主题 + 分区号

重复消费

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5701975.html

【HBZ分享】Kafka的Consumer消费者机制与分区策略讲解与 Rebalance重平衡，通俗易懂

发表评论

评论列表（0条）

【HBZ分享】Kafka的Consumer消费者机制 与 分区策略讲解 与 Rebalance重平衡，通俗易懂

发表评论

评论列表（0条）

【HBZ分享】Kafka的Consumer消费者机制与分区策略讲解与 Rebalance重平衡，通俗易懂