作者:胡呈清
爱可生 DBA 团队成员,善于故障剖析、性能优化,集体博客:https://www.jianshu.com/u/a95…,欢送探讨。
本文起源:原创投稿
* 爱可生开源社区出品,原创内容未经受权不得随便应用,转载请分割小编并注明起源。
如果从库上表 t 数据与主库不统一,导致复制谬误,整个库的数据量很大,重做从库很慢,如何独自复原这张表的数据?通常认为是不能修复单表数据的,因为波及到各表状态不统一的问题。上面就列举备份单表复原到从库会面临的问题以及解决办法:
场景 1
如果复制报错后,没有应用跳过谬误、复制过滤等办法修复主从复制。主库数据始终在更新,从库数据停滞在报错状态(假如 GTID 为 aaaa:1-100)。
修复步骤:
- 在主库上备份表 t(假如备份快照 GTID 为 aaaa:1-10000);
- 复原到从库;
- 启动复制。
这里的问题是复制起始位点是 aaaa:101,从库上表 t 的数据状态是当先其余表的。aaaa:101-10000 这些事务中只有有批改表 t 数据的事务,就会导致复制报错,比方主键抵触、记录不存在(而 aaaa:101 这个之前复制报错的事务必然是批改表 t 的事务)
解决办法:启动复制时跳过 aaaa:101-10000 这些事务中批改表 t 的事务。
正确的修复步骤:
- 在主库上备份表 t(假如备份快照 GTID 为 aaaa:1-10000),复原到从库;
- 设置复制过滤,过滤表 t:
CHANGE REPLICATION FILTER REPLICATE_WILD_IGNORE_TABLE = ('db_name.t');
- 启动复制,回放到 aaaa:10000 时进行复制(此时从库上所有表的数据都在同一状态,是统一的);
START SLAVE UNTIL SQL_AFTER_GTIDS = 'aaaa:10000';
- 删除复制过滤,失常启动复制。
注意事项:这里要用 mysqldump –single-transaction –master-data=2,记录备份快照对应的 GTID
场景 2
如果复制报错后,应用跳过谬误、复制过滤等方法修复了主从复制。主、从库数据始终在更新。
修复步骤:
- 在主库上备份表 t(假如备份快照 GTID 为 aaaa:1-10000);
- 进行从库复制,GTID 为 aaaa:1-20000;
- 复原表 t 到从库;
- 启动复制。
这里的问题是复制起始位点是 aaaa:20001,aaaa:10000-20000 这些事务将不会在从库上回放,如果这外面有批改表 t 数据的事务,从库上将失落这部分数据。
解决办法:从备份开始到启动复制,锁定表 t,保障 aaaa:10000-20000 中没有批改表 t 的事务。
正确修复步骤:
- 对表 t 加读锁;
- 在主库上备份表 t;
- 进行从库复制,复原表 t;
- 启动复制;
- 解锁表 t。
如果是大表,这里能够用可传输表空间形式备份、复原表,缩小锁表工夫。