乐趣区

关于java:面试官数据库自增-ID-用完了会咋样

01 前言

哈喽,好久没更新啦。因为最近在面试。用了两周工夫筹备,在 3 天之内拿了 5 个 offer,最初抉择了广州某互联网行业独角兽 offer,昨天刚入职。这几天刚好整顿下在面试中被问到有意思的问题,也借此机会跟大家分享下。

这家企业的面试官有点意思,一面是个同龄小哥,一起聊了两个小时(聊到我嘴都干了)。他问了我一个无意(keng)思(b)问题:

数据库中的自增 ID 用完了该怎么办?

这个问题其实能够分为 有主键 & 无主键 两种状况答复。

国际惯例,先上张脑图:

1.1 往期精彩

MySQL 查问语句是怎么执行的?

MySQL 索引

MySQL 日志

MySQL 事务与 MVCC

MySQL 的锁机制

MySQL 字符串怎么设计索引?

02 有主键

如果你的表有主键,并且把主键设置为自增。

在 MySQL 中,个别会把主键设置成 int 型。而 MySQL 中 int 型占用 4 个字节,作为有符号位的话范畴就是 [-2^31,2^31-1],也就是[-2147483648,2147483647];无符号位的话最大值就是 2^32-1,也就是 4294967295。

上面以有符号位创立一张表:

CREATE TABLE IF NOT EXISTS `t`(`id` INT(11) NOT NULL AUTO_INCREMENT,
   `url` VARCHAR(64) NOT NULL,
   PRIMARY KEY (`id`)
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入一个 id 为最大值 2147483647 的值,如下图所示:

如果此时持续上面的插入语句:

INSERT INTO t (url) VALUES ('wwww.javafish.top/article/erwt/spring')

后果就会造成主键抵触:

2.1 解决方案

虽说 int 4 个字节,最大数据量能存储 21 亿。你可能会感觉这么大的容量,应该不至于用完。然而互联网时代,每天都产生大量的数据,这是很有可能达到的。

所以,咱们的解决方案是:把主键类型改为 bigint,也就是 8 个字节。这样能存储的最大数据量就是 2^64-1,我也数不清有多少了。反正在你有生之年应该是够用的。

PS:单表 21 亿的数据量显然不事实,一般来说数据量达到 500 万就该分表了

03 没主键

另一种状况就是 建表时没设置主键。这种状况,InnoDB 会主动帮你创立一个不可见的、长度为 6 字节的 row_id,默认是无符号的,所以最大长度是 2^48-1。

实际上 InnoDB 保护了一个全局的 dictsys.row_id,所以 未定义主键的表都共享该 row_id,并不是单表独享。每次插入一条数据,都把全局 row_id 当成主键 id,而后全局 row_id 加 1。

这种状况的数据库自增 ID 用完会产生什么呢?

1、创立一张无显示设置主键的表 t:

CREATE TABLE IF NOT EXISTS `t`(`age` int(4) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、通过 ps -ef|grep mysql 命令获取 mysql 的过程 ID,而后执行命令,通过 gdb 先把 row_id 批改为 1。PS:没有 gdb 的,百度装置下

sudo gdb -p 16111 -ex 'p dict_sys->row_id=1' -batch

呈现下图就是没错的:

3、插入三条数据:

insert into t(age) values(1);
insert into t(age) values(2);
insert into t(age) values(3);

此时的数据库数据:

4、gdb 把 row_id 批改为最大值:281474976710656

sudo gdb -p 16111 -ex 'p dict_sys->row_id=281474976710656' -batch

5、再插入三条数据:

insert into t(age) values(4);
insert into t(age) values(5);
insert into t(age) values(6);

此事的数据库数据:

剖析:

  • 刚开始设置 row_id 为 1,插入三条数据 1、2、3 的 row_id 也理当是 1、2、3;这是没问题的。
  • 接着设置 row_id 为最大值,紧跟着插入三条数据。这时的数据库后果是:4、5、6、3;你会发现 1、2 被笼罩了。
  • row_id 达到后最大值后插入的值 4、5、6 的 row_id 别离是 0、1、2;因为 row_id 为 1、2 的值已存在,所以后者的值 5、6 会笼罩掉 row_id 为 1、2 的值。

论断:row_id 达到最大值后会从 0 从新开始算;后面插入的数据就会被后插入的数据笼罩,且不会报错。

04 总结

数据库自增主键用完后分两种状况:

  • 有主键,报主键抵触
  • 无主键,InnDB 会主动生成一个全局的 row_id。它达到最大值后会从 0 开始算,遇到 row_id 一样时,新数据笼罩旧数据 。所以,咱们还是尽量 给表设置主键

为什么我说这是个无意(keng)思(b)问题?

我的答复除了以上解决办法外,还提到在业务开发中,咱们不会等到主键用完那天就曾经分库分表了,根本不会遇到这种状况。

这时,面试官可能会问你分库分表咋解决,如果你不会就不要被动提了,点到即止。

05 参考文章

  • blog.csdn.net/weixin_39640090/article/details/113227742
  • blog.csdn.net/qq_35393693/article/details/100059966
  • time.geekbang.org/column/article/69862

06 大厂面试题 & 电子书

如果看到这里,喜爱这篇文章的话,请帮点个 难看

初次见面,也不晓得送你们啥。罗唆就送 几百本电子书 2021 最新面试材料 吧。微信搜寻 JavaFish 回复 电子书 送你 1000+ 本编程电子书;回复 面试 送点面试题;回复 1024 送你一套残缺的 java 视频教程。

面试题都是有答案的,具体如下所示:有须要的就来拿吧,相对收费,无套路获取

退出移动版