MySQL数据库日常使用规范

3次阅读

共计 3413 个字符,预计需要花费 9 分钟才能阅读完成。

你向神求助,是因为你相信神;神不帮你,是因为神相信你。

导读:

关于 MySQL 数据库规范,相信大家多少看过一些文档。本篇文章给大家详细分类总结了数据库相关规范,从库表命名设计规范讲起,到索引设计规范,后面又给出 SQL 编写方面的建议。相信这些规范适用于大多数公司,也希望大家都能按照规范来使用我们的数据库,这样我们的数据库才能发挥出更高的性能。

关于库:

  1. 【强制】库的名称必须控制在 32 个字符以内,英文一律小写。
  2. 【强制】库的名称格式:业务系统名称_子系统名。
  3. 【强制】库名只能使用英文字母,数字,下划线,并以英文字母开头。
  4. 【强制】创建数据库时必须显式指定字符集,并且字符集只能是 utf8 或者 utf8mb4。创建数据库 SQL 举例:Create database db1 default character set utf8;
  5. 【建议】临时库、表名以tmp_ 为前缀,并以日期为后缀,备份库、表以 bak_ 为前缀,并以日期为后缀。

关于表

  1. 【强制】表和列的名称必须控制在 32 个字符以内,表名只能使用字母、数字和下划线,一律小写。
  2. 【强制】表名要求模块名强相关,同一模块使用的表名尽量使用统一前缀。
  3. 【强制】创建表时必须显式指定字符集为 utf8 或 utf8mb4。
  4. 【强制】列名尽量不用关键字(如 type,order 等)。
  5. 【强制】创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为 InnoDB。
  6. 【强制】建表必须有 comment。
  7. 【强制】对于超过 100W 行的大表进行 alter table,必须经过 DBA 审核,并在业务低峰期执行,多个 alter 需整合在一起。
    因为 alter table 会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。
  8. 【建议】建表时关于主键:表必须有主键
    (1)强制要求主键为 id,类型为 int 或 bigint,且为 auto_increment 建议使用 unsigned 无符号型。

    (2)标识表里每一行主体的字段不要设为主键,建议设为其他字段如 user_id,order_id 等,并建立 unique key 索引。
    因为如果设为主键且主键值为随机插入,则会导致 innodb 内部 page 分裂和大量随机 I /O,性能下降。

  9. 【建议】核心表(如用户表)必须有行数据的创建时间字段 create_time 和最后更新时间字段 update_time,便于查问题。
  10. 【建议】表中所有字段尽量都是 NOT NULL 属性,业务可以根据需要定义 DEFAULT 值。
    因为使用 NULL 值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。
  11. 【建议】中间表用于保留中间结果集,名称必须以 tmp_ 开头。备份表用于备份或抓取源表快照,名称必须以bak_ 开头。中间表和备份表定期清理。
  12. 【示范】一个较为规范的建表语句:

    CREATE TABLE user_info (
      `id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
      `user_id` bigint(11) NOT NULL COMMENT '用户 id',
      `username` varchar(45) NOT NULL COMMENT '真实姓名',
      `email` varchar(30) NOT NULL COMMENT '用户邮箱',
      `nickname` varchar(45) NOT NULL COMMENT '昵称',
      `birthday` date NOT NULL COMMENT '生日',
      `sex` tinyint(4) DEFAULT '0' COMMENT '性别',
      `short_introduce` varchar(150) DEFAULT NULL COMMENT '一句话介绍自己,最多 50 个汉字',
      `user_resume` varchar(300) NOT NULL COMMENT '用户提交的简历存放地址',
      `user_register_ip` int NOT NULL COMMENT '用户注册时的源 ip',
      `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
      `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间',
      `user_review_status` tinyint NOT NULL COMMENT '用户资料审核状态,1 为通过,2 为审核中,3 为未通过,4 为还未提交审核',
      PRIMARY KEY (`id`),
      UNIQUE KEY `uniq_user_id` (`user_id`),
      KEY `idx_username`(`username`),
      KEY `idx_create_time_status`(`create_time`,`user_review_status`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='网站用户基本信息'

关于索引:

  1. 【强制】InnoDB 表必须主键为 id int/bigint auto_increment, 且主键值禁止被更新。
  2. 【强制】InnoDB 和 MyISAM 存储引擎表,索引类型必须为 BTREE。
  3. 【建议】主键的名称以 pk_ 开头,唯一键以 uniq_uk_ 开头,普通索引以 idx_ 开头,一律使用小写格式,以字段的名称或缩写作为后缀。
  4. 【建议】单个表上的索引个数不能超过 8 个。
  5. 【建议】在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。如列 userid 的区分度可由 select count(distinct userid)计算出来。
  6. 【建议】在多表 join 的 SQL 里,保证被驱动表的连接列上有索引,这样 join 执行效率最高。
  7. 【建议】建表或加索引时,保证表里互相不存在冗余索引。
    对于 MySQL 来说,如果表里已经存在 key(a,b),则 key(a)为冗余索引,需要删除。

SQL 编写:

  1. 【强制】程序端 SELECT 语句必须指定具体字段名称,禁止写成 *。
  2. 【强制】程序端 insert 语句指定具体字段名称,不要写成 insert into t1 values(…)。
  3. 【强制】除静态表或小表(100 行以内),DML 语句必须有 where 条件,且使用索引查找。
  4. 【强制】where 条件里等号左右字段类型必须一致,否则无法利用索引。
  5. 【强制】WHERE 子句中禁止只使用全模糊的 LIKE 条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。
  6. 【强制】索引列不要使用函数或表达式,否则无法利用索引。如 where length(name)=’Admin’ 或 where user_id+2=10023。
  7. 【建议】insert into…values(XX),(XX),(XX).. 这里 XX 的值不要超过 5000 个。
    值过多虽然上线很很快,但会引起主从同步延迟。
  8. 【建议】SELECT 语句不要使用 UNION,推荐使用 UNION ALL,并且 UNION 子句个数限制在 5 个以内。
    因为 union all 不需要去重,节省数据库资源,提高性能。
  9. 【强制】禁止跨 db 的 join 语句。
  10. 【建议】不建议使用子查询,建议将子查询 SQL 拆开结合程序多次查询,或使用 join 来代替子查询。
  11. 【建议】线上环境,多表 join 不要超过 5 个表。
  12. 【建议】在多表 join 中,尽量选取结果集较小的表作为驱动表,来 join 其他表。
  13. 【建议】批量操作数据时,需要控制事务处理间隔时间,进行必要的 sleep。
  14. 【建议】事务里包含 SQL 不超过 5 个
    因为过长的事务会导致锁数据较久,MySQL 内部缓存、连接消耗过多等问题。
  15. 【建议】事务里更新语句尽量基于主键或 unique key,如 update … where id=XX;
    否则会产生间隙锁,内部扩大锁定范围,导致系统性能下降,产生死锁。
  16. 【建议】减少使用 order by,和业务沟通能不排序就不排序,或将排序放到程序端去做。Order by、group by、distinct 这些语句较为耗费 CPU,数据库的 CPU 资源是极其宝贵的。
  17. 【建议】order by、group by、distinct 这些 SQL 尽量利用索引直接检索出排序好的数据。如 where a=1 order by b 可以利用 key(a,b)。
  18. 【建议】包含了 order by、group by、distinct 这些查询的语句,where 条件过滤出来的结果集请保持在 1000 行以内,否则 SQL 会很慢。
正文完
 0