这样计算的问题:
1、 首先这样的计算方法本身是不对的,如果本地时间有问题会导致event时间戳不准,从而出现误差,所以计算公式中会记录一下主从库的当前时间差
公式如下:
注意:这个时间差只会在主从线程启动时计算一次,所以start slave后如果主从本地时间出现异常,Seconds_Behind_Master也是不准的,需要重启复制线程重新计算主从本地时间差异(如果最终计算结果是负数,会归零)
2、 如果IO线程出现延迟,此时这个值是有误差的,Seconds_Behind_Master可能显示为0,但实际和主库是有延迟的,容易出现误差
提示:所以只拿这个值来做复制延迟的监控是不准的,一般都会配合心跳表的时间戳来判断当前延迟
每次进行show slave status时都会进行一次计算
源码如下:
这里可以看到判断SQL线程是否应用所有的event
注意:此时如果IO线程有延迟则即使Seconds_Behind_Master=0但是还是有延迟
关键词解释
单线程复制和并行复制对于last_master_timestamp这个的计算也是不同的
ev->when.tv_sec表示事件的开始时间。exec_time指事件在主库的执行时间,GTID_EVENT和XID_EVENT才会统计exec_time
总结:事务执行中的event时间都是事务开始时begin的时间戳,GTID_EVENT和XID_EVENT则是事务提交的时间,所以如果存在事务长时间未提交就会出现延迟突然增大然后正常的情况
先了解一下并行复制的流程
这导致并行复制和单线程复制之间复制延迟会有差异,差异是slave_checkpoint_period + 事务在备库执行的时间,这就是有时单线程无延迟,换到并行复制反而有轻微延迟的原因
另外DDL的时间戳计算其实是事务执行时间+事务开始时间
本文主要讲述了seconds_behind_master在不同模式下的计算方式,很多情况会导致这个参数不准确,所以也建议大家还是结合心跳表配合监控延迟比较准确,如有理解偏差欢迎随时指正
本文参考:
heartbeat 默认使用udp 694端口进行心跳监测。 如果系统有使用iptables 做防火墙iptables -I INPUT -p udp --dport 694 -j ACCEPT
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)