1、flink的架构
—taskmanager(启动task),jobmanager
Client:Flink 作业在哪台机器上面提交,那么当前机器称之为Client。用户开发的Program 代码,它会构建出DataFlow graph,然后通过Client提交给JobManager。
JobManager:是主(master)节点,相当于Spark的Driver,相当于YARN里面的ResourceManager,生产环境中需要做高可用。JobManager会将任务进行拆分,发送到TaskManager上面执行。 TaskManager:是从节点(slave),相当于Spark的Executor,执行task
2、flink的执行卡槽(共享槽位)
根据并行度设置,几个并行度就是几个task(并行的一个阶段),设置并行度为2,则下列的任务task为5个,source为一个,前面阶段2个task,后面阶段2个task(只不过一个并行度的task可以共享资源)
—这种不行,每个并行的任务都需要占用一个卡槽
—这种的每个并行的任务都在一个卡槽,包含上游端和下游端共享资源
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)