二、案例分享二
2.1 问题形容
主库执行 insert select 批量写入操作,主从复制通过 row 模式下转换为批量的 insert 大事务操作,导致只读实例 CPU 资源以及提早上涨
16:55~17:07
2.2 解决流程
1、接管到只读实例备库提早告警后,咱们察看到只读实例的 CPU 资源有有显著上涨,同时数据库有大量数据写入操作
2、提早期间,只读实例的 tps 的趋势是先降落后上涨,binlog 日志量达到 12.54G,能够推断出主实例传输过去的批量的写入操作是同一事务中,再加上只读实例配置绝对于主实例较低,所以导致这么大的提早
2、查看主从提早期间主实例的状况,能够看到主实例的确执行了大量的数据写入操作,以及主实例审计日志中,咱们找到了批量写入操作
3、只读实例提早趋势 17:05 后,只读实例 tps 上涨,同时同步提早开始降落
4、提早流程形容
- 16:43 主实例执行 insert select 批量写入操作,主库执行结束后,binlog 以 row 的模式将所有的 insert 操作放在一个事务中传输到只读实例
- 16:55 只读实例开始利用该大事务中的 insert 操作,tps 跌落,数据库缓存写 / 日志写上涨
- 17:05 大事务利用结束,开始同步提早期间的 binlog 操作,失常业务下多个小事务操作,tps 上涨显著,提早开始回落
- 10:07 主从追平提早期间的 binlog,主从提早复原为 0