乐趣区

关于mysql:从全备中恢复单库或单表小心有坑

前言:

MySQL 逻辑备份工具最罕用的就是 mysqldump 了,个别咱们都是备份整个实例或局部业务库。不分明你有没有做过复原,复原场景可能就比拟多了,比方我想复原某个库或某个表等。那么如何从全备中复原单库或单表,这其中又有哪些暗藏的坑呢?这篇文章咱们一起来看下。

1. 如何复原单库或单表

后面文章有介绍过 MySQL 的备份与复原。可能咱们每个数据库实例中都不止一个库,个别备份都是备份整个实例,但复原需要又是多种多样的,比如说我想只复原某个库或某张表,这个时候应该怎么操作呢?

如果你的实例数据量不大,能够在另外一个环境复原出整个实例,而后再独自备份出所需库或表用来复原。不过这种办法不够灵便,并且只实用数据量比拟少的状况。

其实从全备中复原单库还是比拟不便的,有个 --one-database 参数能够指定单库复原,上面来具体演示下:

# 查看及备份所有库
mysql> show databases;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| mysql              |
| performance_schema |
| sbtest             |
| sys                |
| testdb             |
| testdb2            |
+--------------------+

mysqldump -uroot -pxxxx  -R -E --single-transaction --all-databases > all_db.sql

# 删除 testdb 库 并进行单库复原
mysql> drop database testdb;
Query OK, 36 rows affected (2.06 sec)

# 貌似复原前 testdb 库不存在的话要手动新建
mysql -uroot -pxxxx --one-database testdb < all_db.sql

除了上述办法外,复原单库或单表还能够采纳手动筛选的办法。这个时候 Linux 下赫赫有名的 sedgrep 命令就派上用场了,咱们能够利用这两个命令从全备中筛选出单库或单表的语句,筛选办法如下:

# 从全备中复原单库
sed -n '/^-- Current Database: `testdb`/,/^-- Current Database: `/p' all_db.sql > testdb.sql

# 筛选出单表语句
cat all_db.sql | sed -e '/./{H;$!d;}' -e 'x;/CREATE TABLE `test_tb`/!d;q' > /tmp/test_tb_info.sql 
cat all_db.sql | grep --ignore-case  'insert into `test_tb`' > /tmp/test_tb_data.sql

2. 小心有坑

对于上述手动筛选来复原单库或单表的办法,看起来简略不便,其实暗藏着一个小坑,上面咱们来具体演示下:

# 备份整个实例
mysqldump -uroot -pxxxx  -R -E --single-transaction --all-databases > all_db.sql

# 手动备份下 test_tb 而后删除 test_tb
mysql> create table test_tb_bak like test_tb;
Query OK, 0 rows affected (0.03 sec)

mysql> insert into test_tb_bak select * from test_tb;
Query OK, 4 rows affected (0.02 sec)
Records: 4  Duplicates: 0  Warnings: 0

mysql> drop table test_tb;
Query OK, 0 rows affected (0.02 sec)

# 从全备中筛选 test_db 建表及插数据语句
cat all_db.sql | sed -e '/./{H;$!d;}' -e 'x;/CREATE TABLE `test_tb`/!d;q' > test_tb_info.sql 
cat all_db.sql | grep --ignore-case  'insert into `test_tb`' > test_tb_data.sql

# 查看失去的语句 貌似没问题
cat test_tb_info.sql

DROP TABLE IF EXISTS `test_tb`;
/*!40101 SET @saved_cs_client     = @@character_set_client */;
/*!40101 SET character_set_client = utf8 */;
CREATE TABLE `test_tb` (`inc_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  `col1` int(11) NOT NULL,
  `col2` varchar(20) DEFAULT NULL,
  `col_dt` datetime DEFAULT NULL,
  `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创立工夫',
  `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '批改工夫',
  PRIMARY KEY (`inc_id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COMMENT='测试表';
/*!40101 SET character_set_client = @saved_cs_client */;

cat test_tb_data.sql

INSERT INTO `test_tb` VALUES (1,1001,'dsfs','2020-08-04 12:12:36','2020-09-17 06:19:27','2020-09-17 06:19:27'),
(2,1002,'vfsfs','2020-09-04 12:12:36','2020-09-17 06:19:27','2020-09-17 06:19:27'),
(3,1003,'adsfsf',NULL,'2020-09-17 06:19:27','2020-09-17 06:19:27'),
(4,1004,'walfd','2020-09-17 14:19:27','2020-09-17 06:19:27','2020-09-18 07:52:13');

# 执行复原单表操作
mysql -uroot -pxxxx testdb < test_tb_info.sql
mysql -uroot -pxxxx testdb < test_tb_data.sql

# 查看复原数据 并和备份表比对
mysql> select * from test_tb;
+--------+------+--------+---------------------+---------------------+---------------------+
| inc_id | col1 | col2   | col_dt              | create_time         | update_time         |
+--------+------+--------+---------------------+---------------------+---------------------+
|      1 | 1001 | dsfs   | 2020-08-04 12:12:36 | 2020-09-17 06:19:27 | 2020-09-17 06:19:27 |
|      2 | 1002 | vfsfs  | 2020-09-04 12:12:36 | 2020-09-17 06:19:27 | 2020-09-17 06:19:27 |
|      3 | 1003 | adsfsf | NULL                | 2020-09-17 06:19:27 | 2020-09-17 06:19:27 |
|      4 | 1004 | walfd  | 2020-09-17 14:19:27 | 2020-09-17 06:19:27 | 2020-09-18 07:52:13 |
+--------+------+--------+---------------------+---------------------+---------------------+
4 rows in set (0.00 sec)

mysql> select * from test_tb_bak;
+--------+------+--------+---------------------+---------------------+---------------------+
| inc_id | col1 | col2   | col_dt              | create_time         | update_time         |
+--------+------+--------+---------------------+---------------------+---------------------+
|      1 | 1001 | dsfs   | 2020-08-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      2 | 1002 | vfsfs  | 2020-09-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      3 | 1003 | adsfsf | NULL                | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      4 | 1004 | walfd  | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 | 2020-09-18 15:52:13 |
+--------+------+--------+---------------------+---------------------+---------------------+
4 rows in set (0.00 sec)

如果你仔细观察的话,会发现复原进去的数据有问题,貌似工夫不太对,你再认真看看,是不是有的时间差了 8 小时!具体探索下来,咱们发现 timestamp 类型字段的工夫数据恢复有问题,精确来讲备份文件中记录的是 0 时区,而咱们零碎个别采纳东八区,所以才会呈现误差 8 小时的问题。

那么你会问了,为什么全副复原不会出问题呢?问的好,咱们看下备份文件就晓得了。

# 备份文件结尾
-- MySQL dump 10.13  Distrib 5.7.23, for Linux (x86_64)
--
-- Host: localhost    Database:
-- ------------------------------------------------------
-- Server version       5.7.23-log

/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;  
留神下面两行
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;


# 备份文件结尾
/*!40103 SET TIME_ZONE=@OLD_TIME_ZONE */;
/*!40101 SET SQL_MODE=@OLD_SQL_MODE */;
/*!40014 SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS */;
/*!40014 SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS */;
/*!40101 SET CHARACTER_SET_CLIENT=@OLD_CHARACTER_SET_CLIENT */;
/*!40101 SET CHARACTER_SET_RESULTS=@OLD_CHARACTER_SET_RESULTS */;
/*!40101 SET COLLATION_CONNECTION=@OLD_COLLATION_CONNECTION */;
/*!40111 SET SQL_NOTES=@OLD_SQL_NOTES */;

-- Dump completed on 2020-09-18 15:56:40

认真看备份文件,你会发现 mysqldump 备份进去的文件中,首先会将会话时区改为 0,结尾处再改回原时区。这就代表着,备份文件中记录的工夫戳数据都是以 0 时区为根底的。如果间接执行筛选出的 SQL,就会造成 0 时区的工夫戳插入的东八区的零碎中,显然会造成工夫相差 8 小时的问题。

看到这里,不晓得你是否看懂了呢,可能有过备份复原教训的同学好了解些。解决上述问题的办法也很简略,那就是在执行 SQL 文件前,更改以后会话时区为 0,再次来演示下:

# 清空 test_db 表数据
mysql> truncate table test_tb;
Query OK, 0 rows affected (0.02 sec)

# 文件结尾减少时区申明
vim test_tb_data.sql
set session TIME_ZONE='+00:00';
INSERT INTO `test_tb` VALUES (1,1001,'dsfs','2020-08-04 12:12:36','2020-09-17 06:19:27','2020-09-17 06:19:27'),
(2,1002,'vfsfs','2020-09-04 12:12:36','2020-09-17 06:19:27','2020-09-17 06:19:27'),
(3,1003,'adsfsf',NULL,'2020-09-17 06:19:27','2020-09-17 06:19:27'),
(4,1004,'walfd','2020-09-17 14:19:27','2020-09-17 06:19:27','2020-09-18 07:52:13');

# 执行复原并比对 发现数据正确
mysql> select * from test_tb;
+--------+------+--------+---------------------+---------------------+---------------------+
| inc_id | col1 | col2   | col_dt              | create_time         | update_time         |
+--------+------+--------+---------------------+---------------------+---------------------+
|      1 | 1001 | dsfs   | 2020-08-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      2 | 1002 | vfsfs  | 2020-09-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      3 | 1003 | adsfsf | NULL                | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      4 | 1004 | walfd  | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 | 2020-09-18 15:52:13 |
+--------+------+--------+---------------------+---------------------+---------------------+
4 rows in set (0.00 sec)

mysql> select * from test_tb_bak;
+--------+------+--------+---------------------+---------------------+---------------------+
| inc_id | col1 | col2   | col_dt              | create_time         | update_time         |
+--------+------+--------+---------------------+---------------------+---------------------+
|      1 | 1001 | dsfs   | 2020-08-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      2 | 1002 | vfsfs  | 2020-09-04 12:12:36 | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      3 | 1003 | adsfsf | NULL                | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 |
|      4 | 1004 | walfd  | 2020-09-17 14:19:27 | 2020-09-17 14:19:27 | 2020-09-18 15:52:13 |
+--------+------+--------+---------------------+---------------------+---------------------+
4 rows in set (0.00 sec)

总结:

咱们在网络中很容易搜寻出复原单库或单表的办法,大多都有提到上述利用 sed、grep 命令来手动筛选的办法。但大部分文章都未提及可能呈现的问题,如果你的表字段有 timestamp 类型,用这种办法要分外留神。无论面对哪种复原需要,咱们都要分外小心,不要造成越复原越蹩脚的状况,最好有个空实例演练下,而后再进行复原。

退出移动版