关于mysql:技术分享-MySQL-如何限制一张表的记录数

作者：杨涛涛

资深数据库专家，专研 MySQL 十余年。善于 MySQL、PostgreSQL、MongoDB 等开源数据库相干的备份复原、SQL 调优、监控运维、高可用架构设计等。目前任职于爱可生，为各大运营商及银行金融企业提供 MySQL 相干技术支持、MySQL 相干课程培训等工作。

本文起源：原创投稿

* 爱可生开源社区出品，原创内容未经受权不得随便应用，转载请分割小编并注明起源。

本文又是来源于客户征询的问题：是否管制单表在一个固定的记录数，比如说 1W 条，超过不让插入新记录或者说间接抛出谬误？

对于这个问题，没有一个简化的答案，比方执行一条命令或者说简略设置一个参数都不能完满解决。接下来我给出一些可选解决方案。

对数据库来讲，个别问题的解决方案无非有两种，一种是在利用端；另外一种是在数据库端。

一、触发器解决方案：

触发器的思路很简略，每次插入新记录前，检查表记录数是否达到限定数量，数量未到，持续插入；数量达到，先插入一条新记录，再删除最老的记录，或者反着来也行。为了防止每次检测表总记录数全表扫，布局另外一张表，用来做以后表的计数器，插入前，只需查计数器表即可。要实现这个需要，须要两个触发器和一张计数器表。

t1 为须要限度记录数的表，t1_count 为计数器表：

mysql:ytt_new>create table t1(id int auto_increment primary key, r1 int);
Query OK, 0 rows affected (0.06 sec)
   
mysql:ytt_new>create table t1_count(cnt smallint unsigned);
Query OK, 0 rows affected (0.04 sec)
   
mysql:ytt_new>insert t1_count set cnt=0;
Query OK, 1 row affected (0.11 sec)

得写两个触发器，一个是插入动作触发：

DELIMITER $$

USE `ytt_new`$$

DROP TRIGGER /*!50032 IF EXISTS */ `tr_t1_insert`$$

CREATE
    /*!50017 DEFINER = 'ytt'@'%' */
    TRIGGER `tr_t1_insert` AFTER INSERT ON `t1` 
    FOR EACH ROW BEGIN
       UPDATE t1_count SET cnt= cnt+1;
    END;
$$

DELIMITER ;

另外一个是删除动作触发：

DELIMITER $$

USE `ytt_new`$$

DROP TRIGGER /*!50032 IF EXISTS */ `tr_t1_delete`$$

CREATE
    /*!50017 DEFINER = 'ytt'@'%' */
    TRIGGER `tr_t1_delete` AFTER DELETE ON `t1` 
    FOR EACH ROW BEGIN
       UPDATE t1_count SET cnt= cnt-1;
    END;
$$

DELIMITER ;

给表 t1 造 1W 条数据，达到下限：

mysql:ytt_new>insert t1 (r1) with recursive tmp(a,b) as (select 1,1 union all select a+1,ceil(rand()*20) from tmp where a<10000 ) select b from tmp;
Query OK, 10000 rows affected (0.68 sec)
Records: 10000  Duplicates: 0  Warnings: 0

计数器表 t1_count 记录为 1W。

mysql:ytt_new>select cnt from t1_count;
+-------+
| cnt   |
+-------+
| 10000 |
+-------+
1 row in set (0.00 sec)

插入前须要判断计数器表是否达到限度，如果到了这个限度则删除老旧记录先。我写一个存储过程简略理下逻辑：

DELIMITER $$

USE `ytt_new`$$

DROP PROCEDURE IF EXISTS `sp_insert_t1`$$

CREATE DEFINER=`ytt`@`%` PROCEDURE `sp_insert_t1`(IN f_r1 INT)
BEGIN
      DECLARE v_cnt INT DEFAULT 0;
      SELECT cnt INTO v_cnt FROM t1_count;
      IF v_cnt >=10000 THEN
        DELETE FROM t1 ORDER BY id ASC LIMIT 1;
      END IF;
      INSERT INTO t1(r1) VALUES (f_r1);          
    END$$

DELIMITER ;

此时，调用存储过程即可实现：

mysql:ytt_new>call sp_insert_t1(9999);
Query OK, 1 row affected (0.02 sec)

mysql:ytt_new>select count(*) from t1;
+----------+
| count(*) |
+----------+
|    10000 |
+----------+
1 row in set (0.01 sec)

这个存储过程的解决逻辑也能够持续优化为一次批量解决。比方每次多缓存一倍的表记录数，判断逻辑变为在 2W 条以前，只插入新记录，并不删除老记录，当达到 2W 条后，一次性删除旧的 1W 条记录。

这种计划有以下几个缺点：

计数器表的记录更新是由 insert/delete 触发，如果对表进行 truncate 则计数器表不触发更新从而数据不统一。
对表进行 drop 操作则触发器也跟着删除，须要重建触发器，重置计数器表。
对表写入只能是相似存储过程这样的繁多入口，不能是其余入口。

二、分区表解决方案

建设一个 range 分区，第一个分区有 1W 条记录，第二个分区为默认分区，等表记录数达到限度后，删除第一个分区，从新调整分区定义即可。

分区表初始定义：

mysql:ytt_new>create table t1(id int auto_increment primary key, r1 int) partition by range(id) (partition p1 values less than(10001), partition p_max values less than(maxvalue));
Query OK, 0 rows affected (0.45 sec)

查找第一个分区是否已满：

mysql:ytt_new>select count(*) from t1 partition(p1);
+----------+
| count(*) |
+----------+
|    10000 |
+----------+
1 row in set (0.00 sec)

删除第一个分区，并且从新调整分区表：

mysql:ytt_new>alter table t1 drop partition p1;
Query OK, 0 rows affected (0.06 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql:ytt_new>alter table t1 reorganize partition p_max into (partition p1 values less than (20001), partition p_max values less than (maxvalue));
Query OK, 0 rows affected (0.60 sec)
Records: 0  Duplicates: 0  Warnings: 0

这种办法的劣势很显著：

表插入入口能够很随机，INSERT 语句、存储过程、导文件都行。
删除第一个分区是一个 DROP 操作，十分快。

但也有毛病：表记录不能有空隙，如果有空隙，就得扭转分区表定义。比方把分区 p1 的最大值改为 20001，那即便在这个分区里有一半的记录不间断，也不影响检索分区里的总记录数。

三、通用表空间解决方案

提前计算好这张表 1W 条记录须要多少磁盘空间，之后在磁盘上划分一个区专门来寄存这张表的数据。

挂载划好的分区，增加为 InnoDB 表空间的备选目录 (/tmp/mysql/)。

mysql:ytt_new>create tablespace ts1 add datafile '/tmp/mysql/ts1.ibd' engine innodb;
Query OK, 0 rows affected (0.11 sec)
mysql:ytt_new>alter table t1 tablespace ts1;
Query OK, 0 rows affected (0.12 sec)
Records: 0  Duplicates: 0  Warnings: 0

我大抵算了下，不是很精确，所以记录上可能有点误差，不过意思曾经很明确：等表报“TABLE IS FULL”后即可。

mysql:ytt_new>insert t1 (r1) values (200);
ERROR 1114 (HY000): The table 't1' is full

mysql:ytt_new>select count(*) from t1;
+----------+
| count(*) |
+----------+
|    10384 |
+----------+
1 row in set (0.20 sec)

表满后移除表空间，清空表，再插入新记录。

mysql:ytt_new>alter table t1 tablespace innodb_file_per_table;
Query OK, 0 rows affected (0.18 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql:ytt_new>drop tablespace ts1;
Query OK, 0 rows affected (0.13 sec)

mysql:ytt_new>truncate table t1;
Query OK, 0 rows affected (0.04 sec)

能够提前在利用端缓存表数据，达到限定的记录数后再批量写入数据库端，写入数据库前，先清空表即可。

举个例子: 表 t1 数据缓存到文件 t1.csv，当 t1.csv 达到 1W 行时，数据库端清空表数据，导入 t1.csv。

之前 MySQL 在 MyISAM 时代，表属性 max_rows 来预估表的记录数，但也不是硬性规定，相似我下面写的应用通用表空间来达到限度表记录数的作用；到了 InnoDB 时代就没有一个直观的办法，更多是靠以上列出来的办法来解决这个问题，具体选哪个计划，还是得看需要。