Flink学习笔记(一)简介

Flink学习笔记(一)简介,第1张

Flink学习笔记(一)简介 学习致谢:

https://www.bilibili.com/video/BV1Gt4y1z7bR?p=2

框架版本


编程语言

Flink官方提供了Java、Scala、Python语言接口用以开发Flink应用程序,但是Flink的源码是使用Java语言进行开发的,且Flink被阿里收购后,未来的主要编程语言都一直会是Java(因为阿里是Java重度使用者! ),且GitHub上关于Flink的项目,大多数是使用Java语言编写的。所以课程中以Java语言为主进行Flink的学习讲解,但会扩展讲解使用其他语言进行Flink开发
https://ci.apache.org/projects/flink/flink-docs-release-1.12/

实时即未来

历史的发展从来不会一帆风顺,随着大数据时代的发展,海量数据和多种业务的实时处理需求激增,比如:实时监控报警系统、实时风控系统、实时推荐系统等,传统的批处理方式和早期的流式处理框架因其自身的局限性,难以在延迟性、吞吐量、容错能力,以及使用便捷性等方面满足业务日益苛刻的要求
在这种形势下,Flink以其独特的天然流式计算特性和更为先进的架构设计,极大地改善了以前的流式处理框架所存在的问题。
扩展阅读:为什么说流处理即未来?
https: // news.qudong.com/article/562521.shtml

一切从Apache开始


Flink诞生于欧洲的一个大数据研究项目StratoSphere。该项目是柏林工业大学的一个研究性项目。早期,Flink是做Batch计算的,但是在2014年,StratoSphere里面的核心成员孵化出Flink,同年将Flink捐赠Apache,并在后来成为Apache的顶级大数据项目,同时Flink计算的主流方向被定位为Streaming,即用流式计算来做所有大数据的计算,这就是Flink技术诞生的背景。
它不仅是一个高吞吐、低延迟的计算引擎,同时还提供很多高级的功能比如它提供了有状态的计算,支持状态管理,支持强一致性的数据语义以及支持基于Event Time的WaterMark对延迟或乱序的数据进行处理等

富二代Flink

2015年阿里巴巴开始使用Flink-并持续贡献社区(阿里内部还基于Flink做了一套Blink),2019年1月8日,阿里巴巴以9000万欧元(7亿元人民币)收购了创业公司Data Artisans。从此Flink开始了新一轮的乘风破浪!
Flink介绍

Flink组件栈

一个计算框架要有长远的发展,必须打造一个完整的Stack。只有上层有了具体的应用,并能很好的发挥计算框架本身的优势,那么这个计算框架才能吸引更多的资源,才会更快的进步。所以Flink也在努力构建自己的Stack。
Flink分层的组件栈如下图所示:每一层所包含的组件都提供了特定的抽象,用来服务于上层组件。

各层详细介绍:
·物理部署层:Flink支持本地运行、能在独立集群或者在被YARN管理的集群上运行,也能部署在云上,该层主要涉及Flink的部署模式,目前Flink支持多种部署模式:本地、集群(Standalone、YARN)、云(GCE/EC2)、Kubenetes。
Flink能够通过该层能够支持不同平台的部署,用户可以根据需要选择使用对应的部署模式。

应用场景

所有的流式计算

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5679268.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存