分享一份京东大数据技术官私藏:Kafka核心设计与实践原理

分享一份京东大数据技术官私藏:Kafka核心设计与实践原理,第1张

分享一份京东大数据技术官私藏:Kafka核心设计与实践原理 什么是Kafka

Kafka起初是由linkedIn 公司采用Scala语言开发的一一个多分区、多副本且基于ZooKeeper协调的分布式消息系统,现已被捐献给Apache基金会。目前Kafka已经定位为一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Storm、Spark、Flink等都支持与Kafka集成。

Kafka为什么会越来越受欢迎

Kafka受欢迎的原因在于它扮演的三大角色:

消息系统: afka 和传统的消息系统(也称作消息中间件〉都具备系统解稿、冗余存储、流量削峰、缓冲、异步通信、扩展性、 可恢复性等功能。与此同时, Kafka供了大多数消息系统难以实现的消息 序性保障及回溯消费的功能

存储系统: Kafka 把消息持久化到磁盘,相比于其他基于内存存储的系统而言,有效地降低了数据丢失的风险 也正是得益于 Kafka 的消息持久化功能和多副本机制,我们可以把 Kafka 作为长期的数据存储系统来使用,只需要把对应的数据保留策略设置为“永久”或启用主题的日志压缩功能即可

流式处理平台: Kafka 不仅为每个流行的流式处理框架提供了可靠的数据来源,提供了一个完整的流式处理类库,比如窗口、连接、变换和聚合等各类 *** 作。

Kafka思维导图

在这个数据科学和分析是一个大问题的世界里,捕获数据到数据库和实时分析系统是一件大事。但是Kafka可以承受这种剧烈的使用情况,所以说Kafka是一个大成就。下面我就为大家介绍一份Kafka的实战PDF。

看完这份PDF能学到什么:本书主要阐述了Kafka中生产者客户端、消费者客户端、主题与分区、日志存储、原理解析、监控管理、应用扩展及流式计算等内容。

◆基础篇介绍Kafka的基础概念、生产者、消费者,以及主题与分区。

◆原理篇包括对日志存储、协议设计、控制器、组协调器、事务、-致性、可靠性等内容的探究。

◆扩展篇从应用扩展层面来做讲解,包括监控、应用工具、应用扩展(延时队列、重试队列、死信队列、消息轨迹等)、与Spark的集成等。

这本Kafka实战PDF总共有12个章节,主要内容如下:

第1章 初识Kafka

第2章 生产者

第3章 消费者

第4章 主题与分区

第5章 日志存储

第6章 深入服务端

第7章 深入客户端

这份深入理解Kafka核心设计与实践原理PDF一共有451页,没有缺页情况

第8章 可靠性探究

第9章 Kafka应用

第10章 Kafka监控

第11章 高级应用

第12章 Kafka与Spark的集成

附录A Kafka源码环境搭建

目录总述

由于篇幅限制小编无法将这份文档全部展现出来,这份深入理解Kafka核心设计与实践原理PDF一共有451页,没有缺页情况,另附赠一些kafka相关技术文档面试题,需要的小伙伴另加说明哦~

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5678678.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存