varchar有最大长度吗
先说结论,mysql 中的 varchar 是有最大长度限制的,这个值是 65535 个字节。
varchar(100),这个 100 的单位是啥,这个单位其实在不同版本中是不一样的。
在早期低版本中代表的是字节,具体哪个版本我也没去验证了,后来被改成了字符,不过可以肯定的是在 5.1 版本后, varchar(100) 就是指 100 个字符。
说到 varchar ,一般都会拿 char 来做比较说明。
char 是固定长度,其单位也是字符,比如 char(10),就表示不管你给的什么值,都会被 mysql 固定保存成 10 个字符。
如果给的字符长度小于 10,那么在尾部就会自动用空格补齐。
如果大于 10,在严格模式(strict sql mode)下就会报错,在非严格模式下就会对内容做自动截取操作。
另外 char 也是有最大长度限制的,最大长度为 255, 即 char 类型最多只能保存 255 个字符,char(256) 这都是错误的写法,可以看下面的例子。
##创建一个表,同时声明address字段长度为256会报错,最大为255
mysql> create table test2 ( address char(256) );
ERROR 1074 (42000): Column length too big for column 'address' (max = 255); use BLOB or TEXT instead
下面是 char 和 varchar 对于同一个字符所需要的不同的存储空间,这里假设使用的是 latin1 单字节字符集。
值 CHAR(4) 存储空间大小(字节) VARCHAR(4) 存储空间大小(字节)
'' ' ' 4 bytes '' 1 byte
'ab' 'ab ' 4 bytes 'ab' 3 bytes
'abcd' 'abcd' 4 bytes 'abcd' 5 bytes
'abcdef' 'abcd' 4 bytes 'abcd' 5 bytes
细心的你可能会发现 varchar 的存储空间会比字符的实际长度多 1 个字节,这是因为 varchar 需要额外增加 1 到 2 个字节来存储字符的长度,这个值被称作前缀。
也就是说在 varchar 类型中,除了字符本身实际占用的空间外,还需要 1 个或 2 个字节来声明这个字符的长度。
如果存储的值小于 255 个字节,则使用 1 个字节来存储前缀,如果大于 255 个字节则使用 2 个字节来存储前缀。
关于字符集和字节的关系,以及字节 (byte) 与位 (bit) 的关系。
1 byte (字节) = 8 bit (位)
2^8 = 256
所以计算机里常见的 255、256 临界值绝大多数与这个有关
1 个字节具体占多大的空间,这与所使用的字符集有关系
比如 latin1 单字节字符集,1 个字符即占 1 个字节
我们常见的 GBK、UTF8、UTF8-MB4 这些都是多字节字符集
GBK :一个字符最多占 2 个字节
UTF8:一个字符最多占 3 个字节
UTF8MB4:一个字符最多占 4 个字节
好了,再坚持一会,回到文章开头的问题,为啥 varchar 最大长度是 65535 个字节呢,其实这个是受 mysql 另一个规则限制导致的,mysql 规定了每行数据大小不能超过 65535 个字节。
另外还有一个小问题,一个字段如果允许为 null ,在 mysql 中也是需要增加额外空间来单独标识的,反之则不需要这个额外空间,至于这个空间大小具体是怎么计算的,我目前也还没有研究过。
结合上面说的几点,下面来通过几个实例来验证下。
##字符集设置为latin1,1个字符=1个字节,字段允许为null
mysql> create table test ( address varchar(65536) default null ) charset=latin1;
ERROR 1074 (42000): Column length too big for column 'address' (max = 65535); use BLOB or TEXT instead
##减去varchar前缀长度标识2个字节,还是报错,说明null标识也占用了空间
mysql> create table test ( address varchar(65533) default null ) charset=latin1;
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs
##把字段设置为非空即可建表成功
mysql> create table test ( address varchar(65533) not null ) charset=latin1;
Query OK, 0 rows affected (0.01 sec)
##如果字符集设置为UTF8,那么 max=65535/3=21845,一个字符最多占3个字节