在应用程序中,经常需要全局唯一的ID作为数据库主键。在一台节点容易全局唯一,那在多台节点呢?

有两个思路:

  • 1使用散列函数,如sha256,加上时间戳、mac地址、cpu负荷、随机数等组成,id足够长,引入多个不确定因素,以至于碰撞几率非常小,可以认为是全局唯一。例如uuid就是这种。但是uuid是字符串的形式,对于DB来说,占用的空间至少大一倍,DB的索引是需要存储和对比的,因此在存储空间和查询时间上面都比整形要低,这种情况在DB的数据条数越多时越明显。
  • 2使用分割法。每个节点都保证自己生成的所有id在本机唯一,每个节点都有一个人为分配的不重复节点编号,插入id中,这样所有节点的id都是全局唯一的。
  • 3利用DB自带的主键唯一性来确保id唯一。但是db的自增id是需要等到事务提交后,ID才算是有效的。有些双向引用的数据,不得不插入后再做一次更新,比较麻烦。

第二种方式是类似Twitter的Snowflake算法,它给每台机器分配一个唯一标识,然后通过时间戳+标识+自增实现全局唯一ID。这种方式好处在于ID生成算法完全是一个无状态机,无网络调用,高效可靠。缺点是如果唯一标识有重复,会造成ID冲突。
Snowflake算法采用41bit毫秒时间戳,加上10bit机器ID(最多支持1024台id服务器),加上12bit***,理论上最多支持1024台机器每秒生成4096000个***。409万个id每秒,在任何交易平台目前都是够用的。

推特的id构成(从最高位往最低位方向):

  • 1位 ,不用。固定是0
  • 41位 ,毫秒时间戳
  • 5位 ,数据中心ID (用于对数据中心进行编码)
  • 5位 ,WORKERID (用于对工作进程进行编码)
  • 12位 ,***。用于同一毫秒产生ID的序列 (自增id)

下面是用golang实现的uuid方法(uuid类型为整形):

package main

import (
	"fmt"

	idworker "github.com/gitstliu/go-id-worker"
)

func main() {
	currWoker := &idworker.IdWorker{}
	currWoker.InitIdWorker(1000, 1)
	newID, err := currWoker.NextId()
	if err == nil {
		fmt.Println(newID)
	}
}

下载库

go get github.com/gitstliu/go-id-worker

下面是在vscode中的调试结果

API server listening at: 127.0.0.1:4442
4917572028174794752
Process exiting with code: 0

用mysql自带的自增id生成全局唯一id

package main

import (
	"database/sql"
	"errors"
	"log"
	"time"
	"fmt"
	_ "github.com/go-sql-driver/mysql"
)


type logger interface {
	Error(error)
}

// Logger Log接口,如果设置了Logger,就使用Logger打印日志,如果没有设置,就使用内置库log打印日志
var Logger logger

// ErrTimeOut 获取uid超时错误
var ErrTimeOut = errors.New("get uid timeout")

type Uid struct {
	db         *sql.DB    // 数据库连接
	businessId string     // 业务id
	ch         chan int64 // id缓冲池
	min, max   int64      // id段最小值,最大值
}

// NewUid 创建一个Uid;len:缓冲池大小()
// db:数据库连接
// businessId:业务id
// len:缓冲池大小(长度可控制缓存中剩下多少id时,去DB中加载)
func NewUid(db *sql.DB, businessId string, len int) (*Uid, error) {
	lid := Uid{
		db:         db,
		businessId: businessId,
		ch:         make(chan int64, len),
	}
	go lid.productId()
	return &lid, nil
}

// Get 获取自增id,当发生超时,返回错误,避免大量请求阻塞,服务器崩溃
func (u *Uid) Get() (int64, error) {
	select {
	case <-time.After(1 * time.Second):
		return 0, ErrTimeOut
	case uid := <-u.ch:
		return uid, nil
	}
}

// productId 生产id,当ch达到最大容量时,这个方法会阻塞,直到ch中的id被消费
func (u *Uid) productId() {
	u.reLoad()

	for {
		if u.min >= u.max {
			u.reLoad()
		}

		u.min++
		u.ch <- u.min
	}
}

// reLoad 在数据库获取id段,如果失败,会每隔一秒尝试一次
func (u *Uid) reLoad() error {
	var err error
	for {
		err = u.getFromDB()
		if err == nil {
			return nil
		}

		// 数据库发生异常,等待一秒之后再次进行尝试
		if Logger != nil {
			Logger.Error(err)
		} else {
			log.Println(err)
		}
		time.Sleep(time.Second)
	}
}

// getFromDB 从数据库获取id段
func (u *Uid) getFromDB() error {
	var (
		maxId int64
		step  int64
	)	
	
	row := u.db.QueryRow("SELECT max_id, step FROM uid;")
	//row = u.db.QueryRow("SELECT max_id, step FROM uid WHERE business_id = ? FOR UPDATE",1)
	if err :=row.Scan(&maxId, &step); err != nil{
		fmt.Printf("scan failed, err:%v",err)
		return err
	}
	
	_, err := u.db.Exec("UPDATE uid SET max_id = ?", maxId+step)
	if err != nil {
		return err
	}
	u.min = maxId
	u.max = maxId + step	

	return nil
}


const (
	DeviceIdBusinessId = "device_id" // 设备id
)

var(
	DeviceIdUid      *Uid
)

func InitUID(db *sql.DB) {
	var err error
	DeviceIdUid, err = NewUid(db, DeviceIdBusinessId, 5)
	if err != nil {
		panic(err)
	}
}


func check(err error) {
	if err != nil {
		panic(err)
	}
}

const (
    USER_NAME = "root"
    PASS_WORD = "123456"
    HOST      = "localhost"
    PORT      = "3306"
    DATABASE  = "test"
    CHARSET   = "utf8"
)

// 
func main() {
	// http init
	
	// http api goroutine

	url := fmt.Sprintf("%s:%[email protected](%s:%s)/%s?charset=%s", USER_NAME, PASS_WORD, HOST, PORT, DATABASE, CHARSET)
	
	db, err := sql.Open("mysql", url)
	if err != nil {
		panic(err)
	}	
	InitUID(db)

	
	for i:=0; i<20; i++ {
		id ,err := DeviceIdUid.Get()
		if err == nil {
			fmt.Println("id=", id)
		} else {
			fmt.Println(err)
		}
	}

}


测试结果:

[[email protected] uid]# go build main.go 
[[email protected] uid]# ./main 
id= 1706
id= 1707
id= 1708
id= 1709
id= 1710
id= 1711
id= 1712
id= 1713
id= 1714
id= 1715
id= 1716
id= 1717
id= 1718
id= 1719
id= 1720
id= 1721
id= 1722
id= 1723
id= 1724
id= 1725
[[email protected] uid]#

改进:上面的是单机版本的uid生成器。单机的流量会有瓶颈。因此是实际的商业部署期间。如果一台不能满足uid,则设置一个单独的http server go程,其它业务节点从本节点获取一段uid(step需要调整,例如从5变成1w),其它节点请求一次,则返回1w个uid,不管这1w个uid有没有用完,都不再分配给其它节点,这样保证了全局唯一性。

以下为uid服务器的架构图:

在这里插入图片描述