【大数据面经系列】大数据开发（实时计算方向）面试题（一）_随笔

【大数据面经系列】大数据开发（实时计算方向）面试题（一）得物

一面

自我介绍实时数仓相关项目介绍flink集群规模与版本多流join有哪些？connect原理与实现flink状态后端有哪些？FSMemory和RocksDBstate有什么区别？flink反压机制如何检测和解决？多个算子的单一算子链如何检测反压？kafka ack机制 kafka rebalance

二面

自我介绍实时模型特征值工程介绍？重点项目介绍频繁查询维表如何处理？频繁update 外存如何处理？端到端的一致性保证sink到kafka中的一致性保证？kafka二阶段提交机制？sink到hdfs如何保证一致性？checkpoint机制与过程实际中遇到的问题 flink kafka connector kafka什么情况下会丢失数据java 垃圾回收javatransient、 volatile关键字，java多线程？checkpoint恢复过程？修改并行度后如何恢复？欢乐互娱

一面

自我介绍如何实现漏斗分析模型（clickhouse）clickhouse视图cdh相关 presto+clickhouse soul

一面

自我介绍实时数仓项目相关特征值与指标计算相关

二面

特征值

永辉

一面

自我介绍项目相关flink checkpoint机制flink端到端一致性如何保证

二面

自我介绍项目相关实时场景如何处理实时数仓建设相关数禾

一面

自我介绍flink 场景 select count(distinct(*))项目相关

二面

flink端到端一致性保证flink任务重启时state如何重新分布特征变量开发相关场景

三面

自我介绍工作中的角色工作中遇到的困难

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5715898.html

【大数据面经系列】大数据开发（实时计算方向）面试题（一）

发表评论

评论列表（0条）