介绍

我们都知道array是固定长度的数组, slice是对array的扩展,本质上是基于数组实现的,主要特点是定义完一个slice变量之后,不需要为它的容量而担心。 本文记录直接深入slice的底层实现原理,不再介绍slice的基本使用。

slice 结构

  • slice中 array 是一个指针,它指向的是一个array,
  • len 代表的是这个slice中的元素长度
  • cap 是slice的容量
type slice struct { 
     array unsafe.Pointer             
     len   int             
     cap   int         
}

slice 扩容

s := []int{1,2,3,4,5,6}
s = append(s, 6)
  • 如果新的slice大小是当前大小2倍以上,则大小增长为新大小
  • 如果当前slice cap 小于1024,按每次2倍增长,否则每次按当前大小1/4增长。直到增长的大小超过或等于新大小
  • append的实现是在内存中将slice的array值赋值到新申请的array上

性能

  • 通过上面我们知道slice的扩容涉及到内存的拷贝,这样带来的好处是数据存储在连续内存上,比随机访问快很多,最直接的性能提升就是缓存命中率会高很多,这也就是为什么slice不采用动态链表实现的原因吧
  • 我们知道拷贝内存数据是有开销的, 而其中最大的开销不在 memmove 数据上,而是在开辟一块新内存malloc及之后的GC压力
  • 拷贝连续内存是很快的,随着cap变大,拷贝总成本还是 O(N) ,只是常数大了
  • 假如不想发生拷贝,那你就没有连续内存。此时随机访问开销会是:链表 O(N)
  • 当你能大致知道所需的最大空间(在大部分时候都是的)时,在make的时候预留相应的 cap 就好
  • 如果需要的空间很大,而且每次都不确定,那就要在浪费内存和耗 CPU 在 malloc + gc 上做权衡
  • 链表的查找操作是从第一个元素开始,所以相对数组要耗时间的多,因为采用这样的结构对读的性能有很大的提高

选择

  • slice是很灵活的,大部分情况都能表现的很好
  • 但也有特殊情况,slice的容量超大并且需要频繁的更改slice的内容时,改用list更合适

注意点
如果你理解了上面内容,那下面这段代码的输出结果你就不意外了

s := []byte{1, 23, 4, 5, 67, 7} 
s1 := s[2:3] s1[0] = 100 
fmt.Printf("s:%+v\n", s) 
// s:[1 23 100 5 67 7] 

没错,切片s 第三位的值4被替换为了100,这是因为 切片s1 的底层array指针指向 切片s 的第三位,因此操作s1会影响切片s