一、简介
雪花算法是Twitter开源的分布式ID生成算法。生成的ID是一个64位的Long类型的数字,是一个全局唯一的ID;当然这64位的全局唯一ID是由时间戳、机器ID、序列号组成的,如果涉及到不同的机房,可以改进下由由时间戳、机房ID、机器ID、序列号组成。具体是如何分配的,如下图所示:
组成部分详解
1、最高位
是符号位,始终为0,因为需要正数;
2、时间戳
第二部分是41位的时间戳,自增的时间戳(毫秒级),最大可以存(2^41 - 1)的毫秒数,差不多可以存69年
3、机房ID
第三部分是5位的机房ID,最大支持(2^5 - 1)数的机房ID
4、机器ID
第四部分是5位的机器ID,最大支持(2^5 - 1)数的机器ID
5、序列号
第五部分是5位的机器ID,最大支持(2^12 - 1)的序列号,意思就是同一毫秒内支持4096个id,同一毫秒内可以生成4096个不同的id
二、思路
我们在生成全局唯一ID的时候,是请求到一个专门生成的ID的主机,请求的时候需要传入我们自己机房ID,机器ID
流程如下:
- 首先最高位不管,是符号位,始终是0;
- 然后将高位后面的41设置为当前时间戳 - 初始化时间戳
- 再将时间戳后面的5位设置为机房ID
- 再将机房ID后面的5位设置位机器ID
- 设置最后12位序列号的时候,如果当前同一毫秒内有多个生成请求,那么就通过这12位的序列号来区分;如果序列号超过最大值,那么就等到下一毫秒再生成。
三、实现
public class MySnowflake {
/** 开始时间戳 */
private final long startTimestamp = 1600758933000L;
/** 机房ID */
private long roomId;
/** 机器ID */
private long workId;
/** 序列号 */
private long serialNum;
/** 机房ID 位长度 */
private final long roomIdBits = 5L;
/** 机器ID 位长度 */
private final long workIdBits = 5L;
/** 序列号 位长度 */
private final long serialNumBits = 12L;
/** 时间戳左移位数 */
private final long timestampShiftBits = roomIdBits + workIdBits + serialNumBits;
/** 机房ID左移位数 */
private final long roomIdShiftBits = workIdBits + serialNumBits;
/** 机器ID左移位数 */
private final long workIdShiftBits = serialNumBits;
/** 机房ID最大值 (-1L ^ (-1L << roomIdBits)) */
private final long roomIdMax = 31L;
/** 机器ID最大值 (-1L ^ (-1L << workIdMax)) */
private final long workIdMax = 31L;
/** 序列号最大值 (-1L ^ (-1L << serialNumBits)) */
private final long serialNumMax = 4095L;
/** 最后一次生成uuid的时间 */
private long lastTimestamp = -1L;
public MySnowflake(long roomId, long workId) {
if (roomId < -1L || roomId > roomIdMax) {
throw new RuntimeException("机房ID无效!");
}
if (workId < -1L || workId > workIdMax) {
throw new RuntimeException("机器ID无效!");
}
this.roomId = roomId;
this.workId = workId;
}
public synchronized long getUUID() {
long currentTimestamp = System.currentTimeMillis();
if (currentTimestamp < lastTimestamp) {
throw new RuntimeException("当前时间戳比上次生成UUID的时间戳小!");
}
// 如果同一时刻同时收到另外一个生成请求,序列号就+1
if (currentTimestamp == lastTimestamp) {
// 如果累加值大于序列号最大值的时候就变为0,等到下一毫秒再生成
serialNum = (serialNum + 1) & serialNumMax;
if (0 == serialNum) {
while (currentTimestamp <= lastTimestamp) {
currentTimestamp = System.currentTimeMillis();
}
}
} else {
serialNum = 0L;
}
lastTimestamp = currentTimestamp;
long uuid = ((currentTimestamp - startTimestamp) << timestampShiftBits)
| (roomId << roomIdShiftBits)
| (workId << workIdShiftBits)
| serialNum;
return uuid;
}
public static void main(String[] args) {
// 机房ID为30,机器ID为30
MySnowflake snowflake = new MySnowflake(30, 30);
for (int i = 0; i < 50; i++) {
System.out.println(snowflake.getUUID());
}
}
}
雪花算法的优点:
- 在内存中完成ID的生成,性能高
- 每秒能生成上百万的自增ID,容量大
- 这样自增的ID,存入到数据中,利于索引
雪花算法的缺点:
- 依赖与环境的时间,如果时间不一致,或者系统时间做了调整前置了,会导致ID冲突重复
好了,这次分享就到这里了,如果有理解不对的欢迎指出,一起学习。