Twitter 的 snowflake 在分布式生成惟一 UUID 利用还是蛮宽泛的,基于 snowflake 的一些变种的算法网上也有不少。应用 snowflake 生成 UUID 很多都是在分布式场景下应用,我看了下网上有其中有几篇 PHP 实现的都没有思考到线程平安。当初 PHP 有了 Swoole 的锁和协程的加持,对于咱们开发线程平安和高并发模拟还是很不便的,这里用 PHP 联合 Swoole 来学习下实现最简略的 snowflake。

先来看以下 snowflake 的构造:

生成的数值是 64 位,分成 4 个局部:

  • 第一个 bit 为符号位,最高位为 0 示意负数
  • 第二局部 41 个 bit 用于记录生成 ID 时候的工夫戳,单位为毫秒,所以该局部示意的数值范畴为 2^41 - 1(69 年),它是绝对于某一时间的偏移量
  • 第三局部的 10 个 bit 示意工作节点的 ID,示意数值范畴为 2^10 - 1,相当于反对 1024 个节点
  • 第四局部 12 个 bit 示意每个工作节点没毫秒生成的循环自增 id,最多能够生成 2^12 -1 个 id,超出归零期待下一毫秒从新自增。
<?phpclass Snowflake{    const EPOCH = 1543223810238;    // 起始工夫戳,毫秒    const SEQUENCE_BITS = 12;   //序号局部12位    const SEQUENCE_MAX = -1 ^ (-1 << self::SEQUENCE_BITS);  // 序号最大值    const WORKER_BITS = 10; // 节点局部10位    const WORKER_MAX = -1 ^ (-1 << self::WORKER_BITS);  // 节点最大数值    const TIME_SHIFT = self::WORKER_BITS + self::SEQUENCE_BITS; // 工夫戳局部左偏移量    const WORKER_SHIFT = self::SEQUENCE_BITS;   // 节点局部左偏移量    protected $timestamp;   // 上次ID生成工夫戳    protected $workerId;    // 节点ID    protected $sequence;    // 序号    protected $lock;        // Swoole 互斥锁    public function __construct($workerId)    {        if ($workerId < 0 || $workerId > self::WORKER_MAX) {            trigger_error("Worker ID 超出范围");            exit(0);        }        $this->timestamp = 0;        $this->workerId = $workerId;        $this->sequence = 0;        $this->lock = new swoole_lock(SWOOLE_MUTEX);    }    /**     * 生成ID     * @return int     */    public function getId()    {        $this->lock->lock();    // 这里肯定要记得加锁        $now = $this->now();        if ($this->timestamp == $now) {            $this->sequence++;            if ($this->sequence > self::SEQUENCE_MAX) {                // 以后毫秒内生成的序号曾经超出最大范畴,期待下一毫秒从新生成                while ($now <= $this->timestamp) {                    $now = $this->now();                }            }        } else {            $this->sequence = 0;        }        $this->timestamp = $now;    // 更新ID生工夫戳        $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;        $this->lock->unlock();  //解锁        return $id;    }    /**     * 获取以后毫秒     * @return string     */    public function now()    {        return sprintf("%.0f", microtime(true) * 1000);    }}

其实逻辑并不简单,解释一下代码中的位运算:

-1 ^ (-1 << self::SEQUENCE_BITS)就是-1的二进制示意为1的补码,其实等同于 :2**self::SEQUENCE_BITS - 1

最初局部左移后或运算:

(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;

这里次要是对除了第一位符号位以外的三个局部进行左移相应的偏移量使其归位,并通过或运算从新整合成下面 snowflake 的构造,比方咱们用 3 局部 4 位来演示一下该归并操作:

0000 0000 0010  --左移0位--> 0000 0000 00100000 0000 0100  --左移4位--> 0000 0100 0000 --或操作-->1000 0100 00100000 0000 1000  --左移8位--> 1000 0000 0000