1.1小对象合并成结构体一次分配,减少内存分配次数
c++里面,小对象在对上频繁申请,会出现内存碎片,导致大的对象时无法申请到连续的内存空间,一般建议使用内存池;
go runtime底层使用内存池,但每个span大小为4k,同时维护一个cache;cache分为0到n的list数组,每个单元挂载一个链表,链表上每个节点的内存块大小是相等的;不同链表的大小块是不等的,当cache不够时再向spanalloc申请;
例如:小对象合并为结构体一次分配
for k,v := range m{
k,v := k,v
go func(){
//using k,v
}()
}
替换为
for k,v := range m{
x := struct {k , v string} {k, v}
go func(){
//using x.k,x.v
}()
}
1.2缓冲区内容一次分配大小空间,并适当复用
在协议编解码时,需要频繁使用[]byte,可以使用bytes.Buffer或其他byte缓存区对象
1.3slice和map创建时,预估大小和指定容量
slice扩容规则:
- 当容量大小为1024以下,按照两倍增长;后续每次按照当前容量的1/4增长
map扩容规则:
- 正常情况下,直接使用buckets,oldbuckets为空;如果正在扩容,oldbuckets不为空,buckets为oldbuckets的2倍
1.4长调用避免申请较多的临时对象
goroutine的调用栈大小为2k,当栈空间不够时,自动创新的栈空间;创建新栈,会把原来栈的变量copy到新的栈空间,变量指针指向新的空间地址;退栈会释放栈空间,gc发现栈空间不到1/4时,则栈空间减少一半;
建议:
- 控制调用栈和函数的复杂度,不要在一个goroutine里做完所有逻辑
- 考虑goroutine池
1.5避免频繁创建临时变量
频繁创建,也需要频繁gc,gc会有短暂的暂停,并消耗cpu
gc优化尽少量的使用临时变量:
- 尽量使用全局变量
- 多个局部变量合并成结构体或数组
1.6高并发任务使用goroutine池
- 过多的goroutine创建,会影响go runtime对goroutine的调度,以及GC消耗
- 高并发若出现异常阻塞积压,大量的goroutine短时间积压可能导致程序奔溃
1.7 避免高并发调用同步系统接口
goroutine的实现,是通过同步模拟异步操作,如下操作不会阻塞goroutine线程调度
- 网络IO
- 锁
- channel
- time.sleep
- 基于底层系统异步调用syscall
下面阻塞会创建新的调度线程: - 本地IO
- 基于底层系统同步调用syscall
- CGO方式调用c语言动态库中的调用IO或其他阻塞
建议:把涉及到同步调用的goroutine,隔离到可控的goroutine中,而不是直接高并调用goroutine
1.8高并发避免共享内存互斥
其他优化1.9避免使用cgo或者减少cgo调用次数
go可以调用c的库函数,但是go有垃圾收集器和go栈动态增长,这里无法与c无缝链接;go环境转入c代码执行前,必须为c创建一个调用栈,把变量赋值给c调用栈,调用结束再拷贝回来;这个调用开销非常大,需要维护go和c的调用上下文,两者调用栈的映射
建议:尽量避免使用cgo,无法避免时,减少跨cgo的调用次数
1.10减少[]byte和string之间的转换,尽量使用[]byte来字符串处理
[]byte和string为不同的数据结构,他们之间的转换为值对象拷贝,尽量减少不必要的转化
建议:字符串拼接,尽量使用[]byte
func Prefix(b []byte) []byte {
return append([]byte("hello", b...))
}
1.11字符串的拼接优先考虑bytes.buffer
由于string类型是不可变类型,但拼接会创建新的string;go中字符串拼接常见如下几种方式:
- string+操作,导致多次对象的分配和值拷贝
- fmt.sprintf 动态解析参数,效率一般
- strings.join,内部是[]byte的append
- bytes.Buffer可以预先分配大小,减少对象分配和拷贝
建议:对于高性能要求,优先考虑bytes.Buffer,预先分配大小