Twitter的分布式雪花算法 SnowFlake 每秒自增生成26个万个可排序的ID

文章来源：企鹅号 - 搜云库

广告关闭

618夏日盛惠

2核2G云服务器首年95元，GPU云服务器低至9.93元/天，还有更多云产品低至0.1折…

概述

分布式系统中，有一些需要使用全局唯一ID的场景，这种时候为了防止ID冲突可以使用36位的UUID，但是UUID有一些缺点，首先他相对比较长，另外UUID一般是无序的。

有些时候我们希望能使用一种简单一些的ID，并且希望ID能够按照时间有序生成。

而twitter的SnowFlake解决了这种需求，最初Twitter把存储系统从MySQL迁移到Cassandra，因为Cassandra没有顺序ID生成机制，所以开发了这样一套全局唯一ID生成服务。

原理

Twitter的雪花算法SnowFlake，使用Java语言实现。

SnowFlake算法产生的ID是一个64位的整型，结构如下（每一部分用“-”符号分隔）：

1位标识部分 ，在java中由于long的最高位是符号位，正数是0，负数是1，一般生成的ID为正数，所以为0；

41位时间戳部分 ，这个是毫秒级的时间，一般实现上不会存储当前的时间戳，而是时间戳的差值（当前时间-固定的开始时间），这样可以使产生的ID从更小值开始；41位的时间戳可以使用69年，(1L

10位节点部分 ，Twitter实现中使用前5位作为数据中心标识，后5位作为机器标识，可以部署1024个节点；

12位序列号部分 ，支持同一毫秒内同一个节点可以生成4096个ID；

SnowFlake算法生成的ID大致上是按照时间递增的，用在分布式系统中时，需要注意数据中心标识和机器标识必须唯一，这样就能保证每个节点生成的ID都是唯一的。或许我们不一定都需要像上面那样使用5位作为数据中心标识，5位作为机器标识，可以根据我们业务的需要，灵活分配节点部分，如：若不需要数据中心，完全可以使用全部10位作为机器标识；若数据中心不多，也可以只使用3位作为数据中心，7位作为机器标识。

snowflake生成的ID整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞（由datacenter和workerId作区分），并且效率较高。据说：snowflake每秒能够产生26万个ID。

源码

本机实测：100万个ID 耗时5秒

循环生成的ID，运行结果如下：

开源地址

Github： https://github.com/souyunku/SnowFlake

发表于: 2018-03-13 2018-03-13 14:25:10

原文链接： http://kuaibao.qq.com/s/20180313G0RYAA00?refer=cp_1026

腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

html自增序号 html雪花符号 java 时间戳到秒 java 时间戳秒 java 时间递增

0

分享

Twitter的分布式雪花算法 SnowFlake 每秒自增生成26个万个可排序的ID

同媒体 快讯

相关 快讯

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐