目录
- GO语言内置的map
- sync.Map
- sync.Map原理分析
- sync.Map的结构
- 查找
- 新增和更新
- 删除
GO语言内置的map
go语言内置一个map数据结构,使用起来非常方便,但是它仅支持并发的读,不支持并发的写,比如下面的代码:
在main函数中开启两个协程同时对m进行并发读和并发写,程序运行之后会报错:
package main func main() { m := make(map[int]int) go func() { for { _ = m[1] } }() go func() { for { m[2] = 2 } }() select {} }
改进
既然不可以并发的写,我们可以给map加一个读写锁,这样就不会有并发写冲突的问题了:
import "sync" func main() { m := make(map[int]int) var lock sync.RWMutex go func() { for { lock.RLock() _ = m[1] lock.RUnlock() } }() go func() { for { lock.Lock() m[2] = 2 lock.Unlock() } }() select {} }
这种方式的实现非常简洁,但也存在一些问题,比如在map的数据非常大的情况下,一把锁会导致大并发的客户端共争一把锁。
sync.Map
sync.Map是官方在sync包中提供的一种并发map,使用起来非常简单,和普通map相比,只有遍历的方式有区别:www.yii666.com
package main import ( "fmt" "sync" ) func main() { var m sync.Map // 1. 写入 m.Store("apple", 1) m.Store("banana", 2) // 2. 读取 price, _ := m.Load("apple") fmt.Println(price.(int)) // 3. 遍历 m.Range(func(key, value interface{}) bool { fruit := key.(string) price := value.(int) fmt.Println(fruit, price) return true }) // 4. 删除 m.Delete("apple") // 5. 读取或写入 m.LoadOrStore("peach", 3) }
sync.Map是通过 read 和 dirty 两个字段将读写分离,读的数据存在只读字段 read 上,将最新写入的数据则存在 dirty 字段上。
读取时会先查询 read,不存在再查询 dirty,写入时则只写入 dirty。
读取 read 并不需要加锁,而读或写 dirty 都需要加锁,另外有 misses 字段来统计 read 被穿透的次数(被穿透指需要读 dirty 的情况),超过一定次数则将 dirty 数据同步到 read 上,对于删除数据则直接通过标记来延迟删除。
在map + 锁的基础上,它有着几个优化点:文章来源站点https://www.yii666.com/
- 空间换时间。 通过冗余的两个数据结构(read、dirty),实现加锁对性能的影响。
- 使用只读数据(read),避免读写冲突。
- 动态调整,miss次数多了之后,将dirty数据提升为read。
- double-checking。
- 延迟删除。 删除一个键值只是打标记,只有在提升dirty的时候才清理删除的数据。
- 优先从read读取、更新、删除,因为对read的读取不需要锁。
sync.Map原理分析
sync.Map的结构
src/sync/map.go
type Map struct { // 当涉及到脏数据(dirty)操作时候,需要使用这个锁 mu Mutex // read是一个只读数据结构,包含一个map结构, // 读不需要加锁,只需要通过 atomic 加载最新的指正即可 read atomic.Value // readOnly // dirty 包含部分map的键值对,如果操作需要mutex获取锁 // 最后dirty中的元素会被全部提升到read里的map去 dirty map[interface{}]*entry // misses是一个计数器,用于记录read中没有的数据而在dirty中有的数据的数量。 // 也就是说如果read不包含这个数据,会从dirty中读取,并misses+1 // 当misses的数量等于dirty的长度,就会将dirty中的数据迁移到read中 misses int }
上述结构体中的read字段实际上是一个包含map的结构体,该结构体中的map是一个read map,对该map的访问不需要加锁,但是增加的元素不会被添加到这个map中,元素会被先增加到dirty中,后续才会被迁移到read只读map中。
readOnly结构体中还有一个amended字段,该字段是一个标志位,用来表示read map中的数据是否完整。假设当前要查找一个key,会先去read map中找,如果没有找到,会判断amended是否为true,如果为true,说明read map的数据不完整,需要去dirty map中找。
// readOnly is an immutable struct stored atomically in the Map.read field. type readOnly struct { // m包含所有只读数据,不会进行任何的数据增加和删除操作 // 但是可以修改entry的指针因为这个不会导致map的元素移动 m map[interface{}]*entry // 标志位,如果为true则表明当前read只读map的数据不完整,dirty map中包含部分数据 amended bool // true if the dirty map contains some key not in m. }
entry
readOnly.mMap.dirty
type entry struct { p unsafe.Pointer // *interface{} }
其中p对应着三种值:
p == nilm.dirty == nilp == expungedm.dirty!=nil
查找
查找元素会调用Load函数,该函数的执行流程:
read.amendedm.dirty
// src/sync/map.go // Load returns the value stored in the map for a key, or nil if no // value is present. // The ok result indicates whether value was found in the map. func (m *Map) Load(key interface{}) (value interface{}, ok bool) { // 首先从只读ready的map中查找,这时不需要加锁 read, _ := m.read.Load().(readOnly) e, ok := read.m[key] // 如果没有找到,并且read.amended为true,说明dirty中有新数据,从dirty中查找,开始加锁了 if !ok && read.amended { m.mu.Lock() // 加锁 // 又在 readonly 中检查一遍,因为在加锁的时候 dirty 的数据可能已经迁移到了read中 read, _ = m.read.Load().(readOnly) e, ok = read.m[key] // read 还没有找到,并且dirty中有数据 if !ok && read.amended { e, ok = m.dirty[key] //从 dirty 中查找数据 // 不管m.dirty中存不存在,都将misses + 1 // missLocked() 中满足条件后就会把m.dirty中数据迁移到m.read中 m.missLocked() } m.mu.Unlock() } if !ok { return nil, false } return e.load() }
misses计数
m.dirty
// src/sync/map.go func (m *Map) missLocked() { m.misses++ if m.misses < len(m.dirty) {//misses次数小于 dirty的长度,就不迁移数据,直接返回 return } m.read.Store(readOnly{m: m.dirty}) //开始迁移数据 m.dirty = nil //迁移完dirty就赋值为nil m.misses = 0 //迁移完 misses归0 }
文章来源地址https://www.yii666.com/blog/310159.html
新增和更新
新增或者更新元素会调用Store函数,该函数的前面几个步骤与Load函数是一样的:
tryStore()unexpungestoreLocked()storeLocked()read.amended
// src/sync/map.go // Store sets the value for a key. func (m *Map) Store(key, value interface{}) { // 直接在read中查找值,找到了,就尝试 tryStore() 更新值 read, _ := m.read.Load().(readOnly) if e, ok := read.m[key]; ok && e.tryStore(&value) { return } // m.read 中不存在 m.mu.Lock() read, _ = m.read.Load().(readOnly) if e, ok := read.m[key]; ok { if e.unexpungeLocked() { // 未被标记成删除,前面讲到entry数据结构时,里面的p值有3种。1.nil 2.expunged,这个值含义有点复杂,可以看看前面entry数据结构 3.正常值 m.dirty[key] = e // 加入到dirty里 } e.storeLocked(&value) // 更新值 } else if e, ok := m.dirty[key]; ok { // 存在于 dirty 中,直接更新 e.storeLocked(&value) } else { // 新的值 if !read.amended { // m.dirty 中没有新数据,增加到 m.dirty 中 // We're adding the first new key to the dirty map. // Make sure it is allocated and mark the read-only map as incomplete. m.dirtyLocked() // 从 m.read中复制未删除的数据 m.read.Store(readOnly{m: read.m, amended: true}) } m.dirty[key] = newEntry(value) //将这个entry加入到m.dirty中 } m.mu.Unlock() }
tryStorestoreLockedtryStore
storeLocked
// tryStore stores a value if the entry has not been expunged. // // If the entry is expunged, tryStore returns false and leaves the entry // unchanged. func (e *entry) tryStore(i *interface{}) bool { for { p := atomic.LoadPointer(&e.p) if p == expunged { return false } if atomic.CompareAndSwapPointer(&e.p, p, unsafe.Pointer(i)) { return true } } }
// storeLocked unconditionally stores a value to the entry. // // The entry must be known not to be expunged. func (e *entry) storeLocked(i *interface{}) { atomic.StorePointer(&e.p, unsafe.Pointer(i)) }
将read map中的值复制到dirty map中:
m.dirtyLocked()
func (m *Map) dirtyLocked() { if m.dirty != nil { return } read, _ := m.read.Load().(readOnly) m.dirty = make(map[interface{}]*entry, len(read.m)) for k, e := range read.m { // 判断值是否被删除,被标记为expunged的值不会被复制到read map中 if !e.tryExpungeLocked() { m.dirty[k] = e } } } // expunged实际上是一个指向空接口的unsafe指针 var expunged = unsafe.Pointer(new(interface{})) func (e *entry) tryExpungeLocked() (isExpunged bool) { p := atomic.LoadPointer(&e.p) // 如果p为nil,就会被标记为expunged for p == nil { if atomic.CompareAndSwapPointer(&e.p, nil, expunged) { return true } p = atomic.LoadPointer(&e.p) } return p == expunged }
下面是对sync.Map进行读写操作的示意图,正常读写且read map中有数据,程序只会访问read map,而不会去加锁:
删除
Delete
e.delete()e.delete()
// src/sync/map.go // Delete deletes the value for a key. func (m *Map) Delete(key interface{}) { // 从 m.read 中开始查找 read, _ := m.read.Load().(readOnly) e, ok := read.m[key] if !ok && read.amended { // m.read中没有找到,并且可能存在于m.dirty中,加锁查找 m.mu.Lock() // 加锁 read, _ = m.read.Load().(readOnly) // 再在m.read中查找一次 e, ok = read.m[key] if !ok && read.amended { //m.read中又没找到,amended标志位true,说明在m.dirty中 delete(m.dirty, key) // 删除 } m.mu.Unlock() } if ok { // 在 m.read 中就直接删除 e.delete() } }
func (e *entry) delete() (hadValue bool) { for { p := atomic.LoadPointer(&e.p) // 已标记为删除 if p == nil || p == expunged { return false } // 原子操作,e.p标记为nil,GO的GC会将对象自动删除 if atomic.CompareAndSwapPointer(&e.p, p, nil) { return true } } }
key究竟什么时候会被删除
我们可以发现,如果read map中存在待删除的key时,程序并不会去直接删除这个key,而是将这个key对应的p指针指向nil。
read -> dirty
dirty -> read