内存优化

1.1小对象合并成结构体一次分配,减少内存分配次数

c++里面,小对象在对上频繁申请,会出现内存碎片,导致大的对象时无法申请到连续的内存空间,一般建议使用内存池;
go runtime底层使用内存池,但每个span大小为4k,同时维护一个cache;cache分为0到n的list数组,每个单元挂载一个链表,链表上每个节点的内存块大小是相等的;不同链表的大小块是不等的,当cache不够时再向spanalloc申请;
例如:小对象合并为结构体一次分配

for k,v := range m{
 k,v := k,v
 go func(){
   //using k,v
 }()
} 

替换为

for k,v := range m{
  x := struct {k , v string} {k, v}
  go func(){
    //using x.k,x.v
  }()
}

1.2缓冲区内容一次分配大小空间,并适当复用

在协议编解码时,需要频繁使用[]byte,可以使用bytes.Buffer或其他byte缓存区对象

1.3slice和map创建时,预估大小和指定容量

slice扩容规则:

  • 当容量大小为1024以下,按照两倍增长;后续每次按照当前容量的1/4增长

map扩容规则:

  • 正常情况下,直接使用buckets,oldbuckets为空;如果正在扩容,oldbuckets不为空,buckets为oldbuckets的2倍

1.4长调用避免申请较多的临时对象

goroutine的调用栈大小为2k,当栈空间不够时,自动创新的栈空间;创建新栈,会把原来栈的变量copy到新的栈空间,变量指针指向新的空间地址;退栈会释放栈空间,gc发现栈空间不到1/4时,则栈空间减少一半;
建议:

  • 控制调用栈和函数的复杂度,不要在一个goroutine里做完所有逻辑
  • 考虑goroutine池

1.5避免频繁创建临时变量

频繁创建,也需要频繁gc,gc会有短暂的暂停,并消耗cpu
gc优化尽少量的使用临时变量:

  • 尽量使用全局变量
  • 多个局部变量合并成结构体或数组
并发优化

1.6高并发任务使用goroutine池

  • 过多的goroutine创建,会影响go runtime对goroutine的调度,以及GC消耗
  • 高并发若出现异常阻塞积压,大量的goroutine短时间积压可能导致程序奔溃

1.7 避免高并发调用同步系统接口

goroutine的实现,是通过同步模拟异步操作,如下操作不会阻塞goroutine线程调度

  • 网络IO
  • channel
  • time.sleep
  • 基于底层系统异步调用syscall
    下面阻塞会创建新的调度线程:
  • 本地IO
  • 基于底层系统同步调用syscall
  • CGO方式调用c语言动态库中的调用IO或其他阻塞
    建议:把涉及到同步调用的goroutine,隔离到可控的goroutine中,而不是直接高并调用goroutine

1.8高并发避免共享内存互斥

其他优化

1.9避免使用cgo或者减少cgo调用次数

go可以调用c的库函数,但是go有垃圾收集器和go栈动态增长,这里无法与c无缝链接;go环境转入c代码执行前,必须为c创建一个调用栈,把变量赋值给c调用栈,调用结束再拷贝回来;这个调用开销非常大,需要维护go和c的调用上下文,两者调用栈的映射
建议:尽量避免使用cgo,无法避免时,减少跨cgo的调用次数

1.10减少[]byte和string之间的转换,尽量使用[]byte来字符串处理

[]byte和string为不同的数据结构,他们之间的转换为值对象拷贝,尽量减少不必要的转化
建议:字符串拼接,尽量使用[]byte

func Prefix(b []byte) []byte {
    return append([]byte("hello", b...))
}

1.11字符串的拼接优先考虑bytes.buffer

由于string类型是不可变类型,但拼接会创建新的string;go中字符串拼接常见如下几种方式:

  • string+操作,导致多次对象的分配和值拷贝
  • fmt.sprintf 动态解析参数,效率一般
  • strings.join,内部是[]byte的append
  • bytes.Buffer可以预先分配大小,减少对象分配和拷贝

建议:对于高性能要求,优先考虑bytes.Buffer,预先分配大小