golang 内存那些事 - Golang教程网

在写这一章节的时候我在考虑关于 golang 内存管理到底要讲到什么程度，毕竟 golang 的内存管理尤其是 golang 的 gc 机制是一门复杂的哲学，非万字长文是说不明白的，我又在网上搜索了一圈发现网上已经有了很好的讲解 golang gc 的文档。这篇文档还是本着实用的原则通过各种例子来讲解 golang 的内存，不会过多涉及 golang 底层实现机制。

make 和 new 的区别

golang 中内存分配有三种方式：1、在声明变量时直接初始化，这是 golang 会为初始化数据分配一段空间；2、使用内置函数 make；3、使用内置函数 new。这里 make 函数只能用于slice，map，chan 三种类型，返回值是一个引用，new 可以用于任意类型，返回值是是一个指针。另外 make 还支持 size 参数，能知道引用底层存储空间的大小。

append 函数是如何处理 slice 的？

前面在第二章节的时候 append 会在底层存储空间不够时 copy 一份数据加大新的存储空间，但是当底层存储空间足够时会发送什么呢？我们看一下下面的例子：

package main

import (
    "fmt"
    "unsafe"
)

func main() {
    a := make([]int, 2, 3)
    fmt.Printf("Address of a=%d\n", unsafe.Pointer(&a[0]))
    a = append(a, 1)
    fmt.Printf("Address of a=%d\n", unsafe.Pointer(&a[0]))
    a = append(a, 1)
    fmt.Printf("Address of a=%d\n", unsafe.Pointer(&a[0]))
}

输出结果：

Address of a=824633811328
Address of a=824633811328
Address of a=824633860288

我们可以看到第一次 append 时存储空间的地址并没有变化，第二次 append 时存储空间地址发送了变化（因为第二次时存储空间已经不足了）。从这儿我们也可以看出在使用 slice 时我们尽量一次性分配足够的空间，这样就是减少因为空间不足带来的内存平凡分配，gc，copy 时带来的cpu 消耗。

另外还需要注意的时，多个 slice 可以共用一个存储空间，通过其中一个 slice 改变了值会影响到其他 slice，看下面例子：

package main

import "fmt"

func main() {
    a := []int{1, 2, 3}
    b := a[1:]
    b[1] = 100
    fmt.Printf("a=%v\n", a)
    b = append(b, 200)
    fmt.Printf("a=%v\n", a)
    fmt.Printf("b=%v\n", b)
}

输出结果：

a=[1 2 100]
a=[1 2 100]
b=[2 100 200]

上面输出结果可以看出第一次 b 的值改变影响到了 a，但是 append 之后 b 指向了新的地址空间，这时候 b 和 a 就没有关系了，b 的改变不会影响 a。

sync.Pool

golang 的 gc 机制会自动回收没有任何引用和任何指针的内存空间，这种机制虽然可以减少程序员因为任务失误找出内存泄露的风险，但是 gc 本身也是消耗 cpu 的，如果频繁的创建，消耗内存空间比如会拖慢整个系统的速度，比如高并发的网络系统，在短时内会有大量数据到达并处理，这就意味着短时内要大量重复的创建内存空间用完后在等到 gc 回收。

golang 为解决这个问题提供了 sync.Pool，sync.Pool 可以临时存放不需要的内存空间，等到下次有新的内存空间需要时可以从 sync.Pool 中直接申领而不必在重新创建。我们来直接看例子：

package main

import (
    "fmt"
    "sync"
    "unsafe"
)

var bufPool = sync.Pool{
    // 当 pool 中没有元素其 Get 方法被调用时会使用这个方法创建元素并返回
    New: func() any {
        return make([]int, 3, 3)
    },
}

func main() {
    testfunc()
    testfunc()
}

func testfunc() {
    a := bufPool.Get().([]int)
    // 在函数栈销毁之前把 a 放入 bufPool，方便下次直接获取
    defer bufPool.Put(a)
    fmt.Printf("Address of a=%v\n", unsafe.Pointer(&a[0]))
}

输出结果：

Address of a=0xc0000ba000
Address of a=0xc0000ba000

可以看到两次调用函数，a 都指向了同一内存。另外需要注意的是 sync.Pool 如果长时间没有被再次利用也会自动销毁的，看一下下面这个例子：

package main

import (
    "fmt"
    "sync"
    "time"
    "unsafe"
)

var bufPool = sync.Pool{
    // 当 pool 中没有元素其 Get 方法被调用时会使用这个方法创建元素并返回
    New: func() any {
        return make([]int, 3, 3)
    },
}

func main() {
    testfunc()
    // 多了 sleep，在 sleep 期间 bufPool 里的空间会被释放
    time.Sleep(10 * time.Second)
    testfunc()
}

func testfunc() {
    a := bufPool.Get().([]int)
    // 在函数栈销毁之前把 a 放入 bufPool，方便下次直接获取
    defer bufPool.Put(a)
    fmt.Printf("Address of a=%v\n", unsafe.Pointer(&a[0]))
}

输出结果：

Address of a=0xc000016180
Address of a=0xc000094000

可以看到就是加了个 sleep，两次函数调用 a 指向的空间地址就不同了。