Flink学习笔记（一）简介_随笔

Flink学习笔记（一）简介学习致谢：

https://www.bilibili.com/video/BV1Gt4y1z7bR?p=2

框架版本

编程语言

Flink官方提供了Java、Scala、Python语言接口用以开发Flink应用程序，但是Flink的源码是使用Java语言进行开发的，且Flink被阿里收购后，未来的主要编程语言都一直会是Java（因为阿里是Java重度使用者! )，且GitHub上关于Flink的项目，大多数是使用Java语言编写的。所以课程中以Java语言为主进行Flink的学习讲解，但会扩展讲解使用其他语言进行Flink开发
https://ci.apache.org/projects/flink/flink-docs-release-1.12/

实时即未来

历史的发展从来不会一帆风顺，随着大数据时代的发展，海量数据和多种业务的实时处理需求激增，比如:实时监控报警系统、实时风控系统、实时推荐系统等，传统的批处理方式和早期的流式处理框架因其自身的局限性，难以在延迟性、吞吐量、容错能力，以及使用便捷性等方面满足业务日益苛刻的要求
在这种形势下，Flink以其独特的天然流式计算特性和更为先进的架构设计，极大地改善了以前的流式处理框架所存在的问题。
扩展阅读:为什么说流处理即未来?
https: // news.qudong.com/article/562521.shtml

一切从Apache开始

Flink诞生于欧洲的一个大数据研究项目StratoSphere。该项目是柏林工业大学的一个研究性项目。早期，Flink是做Batch计算的，但是在2014年，StratoSphere里面的核心成员孵化出Flink，同年将Flink捐赠Apache，并在后来成为Apache的顶级大数据项目，同时Flink计算的主流方向被定位为Streaming，即用流式计算来做所有大数据的计算，这就是Flink技术诞生的背景。
它不仅是一个高吞吐、低延迟的计算引擎，同时还提供很多高级的功能比如它提供了有状态的计算，支持状态管理，支持强一致性的数据语义以及支持基于Event Time的WaterMark对延迟或乱序的数据进行处理等

富二代Flink

2015年阿里巴巴开始使用Flink-并持续贡献社区(阿里内部还基于Flink做了一套Blink)，2019年1月8日，阿里巴巴以9000万欧元(7亿元人民币)收购了创业公司Data Artisans。从此Flink开始了新一轮的乘风破浪!
Flink介绍

Flink组件栈

一个计算框架要有长远的发展，必须打造一个完整的Stack。只有上层有了具体的应用，并能很好的发挥计算框架本身的优势，那么这个计算框架才能吸引更多的资源，才会更快的进步。所以Flink也在努力构建自己的Stack。
Flink分层的组件栈如下图所示:每一层所包含的组件都提供了特定的抽象，用来服务于上层组件。

各层详细介绍:
·物理部署层:Flink支持本地运行、能在独立集群或者在被YARN管理的集群上运行，也能部署在云上，该层主要涉及Flink的部署模式，目前Flink支持多种部署模式:本地、集群(Standalone、YARN)、云(GCE/EC2)、Kubenetes。
Flink能够通过该层能够支持不同平台的部署，用户可以根据需要选择使用对应的部署模式。

应用场景

所有的流式计算

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5679268.html

Flink学习笔记（一）简介

发表评论

评论列表（0条）