Flink性能问题定位
看反压
通常最后一个被压高的subTask的下游就是job的瓶颈之一
看checkpoint时长
checkpoint时长能在一定程度影响job的整体吞吐
看核心指标
延迟和吞吐是最重要的指标
资源使用率
提高资源利用率是最终目的。排查首先看GC
常见性能问题
- JSON序列化和反序列化
- MAP和Set的Hash冲突
- 和低速系统交互 如MySQL,HBASE
- 数据倾斜
- 频繁GC 甚至TM失联
- 大窗口 窗口size大、数据量大,或者滑动窗口size和step比值比较大如size=5min,step=1s
相关推荐
raidtest 2020-10-09
匆匆那些年 2020-06-27
oXiaoChong 2020-06-20
yuchuanchen 2020-06-16
Spark高级玩法 2020-06-14
Leonwey 2020-06-11
Spark高级玩法 2020-06-09
文报 2020-06-09
xorxos 2020-06-07
xiaoyutongxue 2020-05-27
yuchuanchen 2020-05-27
阿尼古 2020-05-26
千慧 2020-05-18
yuchuanchen 2020-05-17
yuchuanchen 2020-05-16
Spark高级玩法 2020-05-11
yuchuanchen 2020-05-11