共计 3413 个字符,预计需要花费 9 分钟才能阅读完成。
你向神求助,是因为你相信神;神不帮你,是因为神相信你。
导读:
关于 MySQL 数据库规范,相信大家多少看过一些文档。本篇文章给大家详细分类总结了数据库相关规范,从库表命名设计规范讲起,到索引设计规范,后面又给出 SQL 编写方面的建议。相信这些规范适用于大多数公司,也希望大家都能按照规范来使用我们的数据库,这样我们的数据库才能发挥出更高的性能。
关于库:
- 【强制】库的名称必须控制在 32 个字符以内,英文一律小写。
- 【强制】库的名称格式:业务系统名称_子系统名。
- 【强制】库名只能使用英文字母,数字,下划线,并以英文字母开头。
- 【强制】创建数据库时必须显式指定字符集,并且字符集只能是 utf8 或者 utf8mb4。创建数据库 SQL 举例:Create database db1 default character set utf8;
- 【建议】临时库、表名以
tmp_
为前缀,并以日期为后缀,备份库、表以bak_
为前缀,并以日期为后缀。
关于表
- 【强制】表和列的名称必须控制在 32 个字符以内,表名只能使用字母、数字和下划线,一律小写。
- 【强制】表名要求模块名强相关,同一模块使用的表名尽量使用统一前缀。
- 【强制】创建表时必须显式指定字符集为 utf8 或 utf8mb4。
- 【强制】列名尽量不用关键字(如 type,order 等)。
- 【强制】创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为 InnoDB。
- 【强制】建表必须有 comment。
- 【强制】对于超过 100W 行的大表进行 alter table,必须经过 DBA 审核,并在业务低峰期执行,多个 alter 需整合在一起。
因为 alter table 会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。 - 【建议】建表时关于主键:表必须有主键
(1)强制要求主键为 id,类型为 int 或 bigint,且为 auto_increment 建议使用 unsigned 无符号型。(2)标识表里每一行主体的字段不要设为主键,建议设为其他字段如 user_id,order_id 等,并建立 unique key 索引。
因为如果设为主键且主键值为随机插入,则会导致 innodb 内部 page 分裂和大量随机 I /O,性能下降。 - 【建议】核心表(如用户表)必须有行数据的创建时间字段 create_time 和最后更新时间字段 update_time,便于查问题。
- 【建议】表中所有字段尽量都是 NOT NULL 属性,业务可以根据需要定义 DEFAULT 值。
因为使用 NULL 值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。 - 【建议】中间表用于保留中间结果集,名称必须以
tmp_
开头。备份表用于备份或抓取源表快照,名称必须以bak_
开头。中间表和备份表定期清理。 -
【示范】一个较为规范的建表语句:
CREATE TABLE user_info ( `id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', `user_id` bigint(11) NOT NULL COMMENT '用户 id', `username` varchar(45) NOT NULL COMMENT '真实姓名', `email` varchar(30) NOT NULL COMMENT '用户邮箱', `nickname` varchar(45) NOT NULL COMMENT '昵称', `birthday` date NOT NULL COMMENT '生日', `sex` tinyint(4) DEFAULT '0' COMMENT '性别', `short_introduce` varchar(150) DEFAULT NULL COMMENT '一句话介绍自己,最多 50 个汉字', `user_resume` varchar(300) NOT NULL COMMENT '用户提交的简历存放地址', `user_register_ip` int NOT NULL COMMENT '用户注册时的源 ip', `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间', `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间', `user_review_status` tinyint NOT NULL COMMENT '用户资料审核状态,1 为通过,2 为审核中,3 为未通过,4 为还未提交审核', PRIMARY KEY (`id`), UNIQUE KEY `uniq_user_id` (`user_id`), KEY `idx_username`(`username`), KEY `idx_create_time_status`(`create_time`,`user_review_status`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='网站用户基本信息'
关于索引:
- 【强制】InnoDB 表必须主键为 id int/bigint auto_increment, 且主键值禁止被更新。
- 【强制】InnoDB 和 MyISAM 存储引擎表,索引类型必须为 BTREE。
- 【建议】主键的名称以
pk_
开头,唯一键以uniq_
或uk_
开头,普通索引以idx_
开头,一律使用小写格式,以字段的名称或缩写作为后缀。 - 【建议】单个表上的索引个数不能超过 8 个。
- 【建议】在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。如列 userid 的区分度可由 select count(distinct userid)计算出来。
- 【建议】在多表 join 的 SQL 里,保证被驱动表的连接列上有索引,这样 join 执行效率最高。
- 【建议】建表或加索引时,保证表里互相不存在冗余索引。
对于 MySQL 来说,如果表里已经存在 key(a,b),则 key(a)为冗余索引,需要删除。
SQL 编写:
- 【强制】程序端 SELECT 语句必须指定具体字段名称,禁止写成 *。
- 【强制】程序端 insert 语句指定具体字段名称,不要写成 insert into t1 values(…)。
- 【强制】除静态表或小表(100 行以内),DML 语句必须有 where 条件,且使用索引查找。
- 【强制】where 条件里等号左右字段类型必须一致,否则无法利用索引。
- 【强制】WHERE 子句中禁止只使用全模糊的 LIKE 条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。
- 【强制】索引列不要使用函数或表达式,否则无法利用索引。如 where length(name)=’Admin’ 或 where user_id+2=10023。
- 【建议】insert into…values(XX),(XX),(XX).. 这里 XX 的值不要超过 5000 个。
值过多虽然上线很很快,但会引起主从同步延迟。 - 【建议】SELECT 语句不要使用 UNION,推荐使用 UNION ALL,并且 UNION 子句个数限制在 5 个以内。
因为 union all 不需要去重,节省数据库资源,提高性能。 - 【强制】禁止跨 db 的 join 语句。
- 【建议】不建议使用子查询,建议将子查询 SQL 拆开结合程序多次查询,或使用 join 来代替子查询。
- 【建议】线上环境,多表 join 不要超过 5 个表。
- 【建议】在多表 join 中,尽量选取结果集较小的表作为驱动表,来 join 其他表。
- 【建议】批量操作数据时,需要控制事务处理间隔时间,进行必要的 sleep。
- 【建议】事务里包含 SQL 不超过 5 个
因为过长的事务会导致锁数据较久,MySQL 内部缓存、连接消耗过多等问题。 - 【建议】事务里更新语句尽量基于主键或 unique key,如 update … where id=XX;
否则会产生间隙锁,内部扩大锁定范围,导致系统性能下降,产生死锁。 - 【建议】减少使用 order by,和业务沟通能不排序就不排序,或将排序放到程序端去做。Order by、group by、distinct 这些语句较为耗费 CPU,数据库的 CPU 资源是极其宝贵的。
- 【建议】order by、group by、distinct 这些 SQL 尽量利用索引直接检索出排序好的数据。如 where a=1 order by b 可以利用 key(a,b)。
- 【建议】包含了 order by、group by、distinct 这些查询的语句,where 条件过滤出来的结果集请保持在 1000 行以内,否则 SQL 会很慢。
正文完