关于运维:MySQL主从延迟问题排查二

41次阅读

共计 570 个字符,预计需要花费 2 分钟才能阅读完成。

二、案例分享二

2.1 问题形容

主库执行 insert  select 批量写入操作,主从复制通过 row 模式下转换为批量的 insert 大事务操作,导致只读实例 CPU 资源以及提早上涨

16:55~17:07

2.2 解决流程

1、接管到只读实例备库提早告警后,咱们察看到只读实例的 CPU 资源有有显著上涨,同时数据库有大量数据写入操作

2、提早期间,只读实例的 tps 的趋势是先降落后上涨,binlog 日志量达到 12.54G,能够推断出主实例传输过去的批量的写入操作是同一事务中,再加上只读实例配置绝对于主实例较低,所以导致这么大的提早

2、查看主从提早期间主实例的状况,能够看到主实例的确执行了大量的数据写入操作,以及主实例审计日志中,咱们找到了批量写入操作

3、只读实例提早趋势 17:05 后,只读实例 tps 上涨,同时同步提早开始降落

4、提早流程形容

  • 16:43 主实例执行 insert select 批量写入操作,主库执行结束后,binlog 以 row 的模式将所有的 insert 操作放在一个事务中传输到只读实例
  • 16:55 只读实例开始利用该大事务中的 insert 操作,tps 跌落,数据库缓存写 / 日志写上涨
  • 17:05 大事务利用结束,开始同步提早期间的 binlog 操作,失常业务下多个小事务操作,tps 上涨显著,提早开始回落
  • 10:07 主从追平提早期间的 binlog,主从提早复原为 0
正文完
 0