二、案例分享二

2.1 问题形容

主库执行insert  select 批量写入操作,主从复制通过row模式下转换为批量的insert大事务操作,导致只读实例CPU资源以及提早上涨

16:55~17:07

2.2 解决流程

1、接管到只读实例备库提早告警后,咱们察看到只读实例的CPU资源有有显著上涨,同时数据库有大量数据写入操作

2、提早期间,只读实例的tps的趋势是先降落后上涨,binlog日志量达到12.54G,能够推断出主实例传输过去的批量的写入操作是同一事务中,再加上只读实例配置绝对于主实例较低,所以导致这么大的提早

2、查看主从提早期间主实例的状况,能够看到主实例的确执行了大量的数据写入操作,以及主实例审计日志中,咱们找到了批量写入操作

3、只读实例提早趋势17:05后,只读实例tps上涨,同时同步提早开始降落

4、提早流程形容

  • 16:43 主实例执行insert select批量写入操作,主库执行结束后,binlog以row的模式将所有的insert操作放在一个事务中传输到只读实例
  • 16:55 只读实例开始利用该大事务中的insert操作,tps跌落,数据库缓存写/日志写上涨
  • 17:05 大事务利用结束,开始同步提早期间的binlog操作,失常业务下多个小事务操作,tps上涨显著,提早开始回落
  • 10:07 主从追平提早期间的binlog,主从提早复原为0