01 前言


哈喽,好久没更新啦。因为最近在面试。用了两周时间准备,在 3 天之内拿了 5 个 offer,最后选择了广州某互联网行业独角兽 offer,昨天刚入职。这几天刚好整理下在面试中被问到有意思的问题,也借此机会跟大家分享下。


这家企业的面试官有点意思,一面是个同龄小哥,一起聊了两个小时(聊到我嘴都干了)。他问了我一个有意(keng)思(b)问题:


数据库中的自增 ID 用完了该怎么办?


这个问题其实可以分为 有主键 & 无主键 两种情况回答。


国际惯例,先上张脑图:


640.png


02 有主键


如果你的表有主键,并且把主键设置为自增。


在 MySQL 中,一般会把主键设置成 int 型。而 MySQL 中 int 型占用 4 个字节,作为有符号位的话范围就是 [-2^31,2^31-1],也就是 [-2147483648,2147483647];无符号位的话最大值就是 2^32-1,也就是 4294967295。


下面以有符号位创建一张表:


CREATE TABLE IF NOT EXISTS `t`(
   `id` INT(11) NOT NULL AUTO_INCREMENT,
   `url` VARCHAR(64) NOT NULL,
   PRIMARY KEY ( `id` )
)ENGINE=InnoDB DEFAULT CHARSET=utf8;


插入一个 id 为最大值 2147483647 的值,如下图所示:


640.png


如果此时继续下面的插入语句:


INSERT INTO t (url) VALUES ('wwww.javafish.top/article/erwt/spring')


结果就会造成主键冲突:


640.png


2.1 解决方案


虽说 int 4 个字节,最大数据量能存储 21 亿。你可能会觉得这么大的容量,应该不至于用完。但是互联网时代,每天都产生大量的数据,这是很有可能达到的。


所以,我们的解决方案是: 把主键类型改为 bigint,也就是 8 个字节 。这样能存储的最大数据量就是 2^64-1,我也数不清有多少了。反正在你有生之年应该是够用的。


PS: 单表 21 亿的数据量显然不现实,一般来说数据量达到 500 万就该分表了


03 没主键


另一种情况就是 建表时没设置主键 。这种情况,InnoDB 会自动帮你创建一个不可见的、长度为 6 字节的 row_id,默认是无符号的,所以最大长度是 2^48-1。


实际上 InnoDB 维护了一个全局的 dictsys.row_id,所以 未定义主键的表都共享该 row_id,并不是单表独享 。每次插入一条数据,都把全局 row_id 当成主键 id,然后全局 row_id 加 1。


这种情况的数据库自增 ID 用完会发生什么呢?


1、创建一张无显示设置主键的表 t:


CREATE TABLE IF NOT EXISTS `t`(
   `age` int(4) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8;


2、通过 ps -ef|grep mysql 命令获取 mysql 的进程 ID,然后执行命令,通过 gdb 先把 row_id 修改为 1。PS:没有 gdb 的,百度安装下


sudo gdb -p 16111 -ex 'p dict_sys->row_id=1' -batch


出现下图就是没错的:


640.png


3、插入三条数据:


insert into t(age) values(1);
insert into t(age) values(2);
insert into t(age) values(3);


此时的数据库数据:


640.png


4、gdb 把 row_id 修改为最大值:281474976710656


sudo gdb -p 16111 -ex 'p dict_sys->row_id=281474976710656' -batch


5、再插入三条数据:


insert into t(age) values(4);
insert into t(age) values(5);
insert into t(age) values(6);


此事的数据库数据:


640.png


分析:


  • 刚开始设置 row_id 为 1,插入三条数据 1、2、3 的 row_id 也理应是 1、2、3;这是没问题的。
  • 接着设置 row_id 为最大值,紧跟着插入三条数据。这时的数据库结果是:4、5、6、3;你会发现 1、2 被覆盖了。
  • row_id 达到后最大值后插入的值 4、5、6 的 row_id 分别是 0、1、2;由于 row_id 为 1、2 的值已存在,所以后者的值 5、6 会覆盖掉 row_id 为 1、2 的值。


结论:row_id 达到最大值后会从 0 重新开始算;前面插入的数据就会被后插入的数据覆盖,且不会报错。


04 总结


数据库自增主键用完后分两种情况:


  • 有主键, 报主键冲突
  • 无主键,InnDB 会自动生成一个全局的 row_id。它到达最大值后会从 0 开始算,遇到 row_id 一样时, 新数据覆盖旧数据 。所以,我们还是尽量 给表设置主键


为什么我说这是个有意(keng)思(b)问题?


我的回答除了以上解决方法外,还提到在业务开发中,我们不会等到主键用完那天就已经分库分表了,基本不会遇到这种情况。


这时,面试官可能会问你分库分表咋处理,如果你不会就不要主动提了,点到即止。

【MySQL从入门到精通】【高级篇】(二十六)建了索引就能用么?我看未必。来看看几种索引失效的情况吧
【MySQL从入门到精通】【高级篇】(二十五)EXPLAIN中ref、rows、filtered、Extra字段的剖析 通过前面几篇文章的学习,相信小伙伴们对EXPLAIN命令有了一个更加深入理解。这篇文章我们将来学习索引失效的11种情况。有时候并不是说加了索引,就一定能用上索引,还是要具体情况具体分析。
这篇文章将为你解答疑惑 1. 定义 事务(Transaction),一般是指要做的或所做的事情。在计算机术语中是指访问并可能更新数据库中各种数据项的一个程序执行单元(unit)。事务通常由高级数据库操纵语言或编程语言(如SQL,C++或Java)书写的用户程序的执行所引起,并用形如begin transaction和end transaction语句(或函数调用)来界定。 事务的提交是指事务 面试官:数据库自增ID用完了会怎么样?
看到这个问题,我想起当初玩魔兽世界的时候,25H难度的脑残吼的血量已经超过了21亿,所以那时候副本的BOSS都设计成了转阶段、回血的模式,因为魔兽的血量是int型,不能超过2^32大小。 估计暴雪的设计师都没想到几个资料片下来血量都超过int上限了,以至于大家猜想才会有后来的属性压缩。 这些都是题外话,只是告诉你数据量大了是有可能达到上限的而已,回到Mysql自增ID上限的问题,可以分为两个方面来说。 【肝帝一周总结:全网最全最细】☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》
【肝帝一周总结:全网最全最细】☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》