本文介绍golang 如何做基准性能测试。
编写完代码除了跑必要的单元测试外,还需要考虑代码跑起来的性能如何。性能的衡量其实就是程序运行时候进程的内存分配,CPU消耗情况。
golang 语言在提供了功能测试的基础上,提供了丰富的性能测试功能。
SHOW CODE
首先,从一个例子来讲起。 随便写一个简单的快速排序,然后和系统自带的排序做一个性能比较。
如下为简版快排的代码:
package benchmark
import "sort"
func QSort(data []int) {
myqsort(data, 0, len(data)-1)
}
func myqsort(data []int, s, e int) {
if s >= e {
return
}
t := data[s]
i, j := s, e
for i < j {
for ; i < j && data[j] >= t; j-- { }
for ; i < j && data[i] < t; i++ { }
if i < j { break }
data[i], data[j] = data[j], data[i]
i++
j--
}
data[i] = t
myqsort(data, s, i-1)
myqsort(data, i+1, e)
}
然后编写一个测试的test。
package benchmark
import "testing"
import "math/rand"
import "time"
import "sort"
var ints []int
// 长度为 1w 的数据使用系统自带排序
func BenchmarkSort10k(t *testing.B) {
slice := ints[0:10000]
t.ResetTimer() // 只考虑下面代码的运行事件,所以重置计时器
for i := 0; i < t.N; i++ {
sort.Ints(slice)
}
}
// 长度为 100 的数据使用系统自带排序
func BenchmarkSort100(t *testing.B) {
slice := ints[0:100]
t.ResetTimer()
for i := 0; i < t.N; i++ {
sort.Ints(slice)
}
}
// 长度为 1w 的数据使用上述代码排序
func BenchmarkQsort10k(t *testing.B) {
slice := ints[0:10000]
t.ResetTimer()
for i := 0; i < t.N; i++ {
QSort(slice)
}
}
// 长度为 100 的数据使用上述代码排序
func BenchmarkQsort100(t *testing.B) {
slice := ints[0:100]
t.ResetTimer()
for i := 0; i < t.N; i++ {
QSort(slice)
}
}
// 数据初始化,为了保证每次数据都是一致的。
func TestMain(m *testing.M) {
rand.Seed(time.Now().Unix())
ints = make([]int, 10000)
for i := 0; i < 10000; i++ {
ints[i] = rand.Int()
}
m.Run()
}
运行命令 :
# go test -cover -count 3 -benchmem -bench=.
运行结果如下图:
基准测试,默认将每个方法执行1s中,然后展示执行的次数,每一次执行的耗时, 上述还展示了内存每次分配的大小,以及每次benchmark分配的次数。上述的命令行指定了运行次数为3次,显示代码覆盖率和内存分配情况。
从基准测试的结果可以分析出:对于1w数据量的排序,自带的排序比我的排序算法要快20倍左右;100数据量的排序,手撸的排序略胜一筹。
从内存分析来讲,系统自带的会使用4B的数据,而我的算法无内存分配。
INTRODUCE BENCHMARK
testing
若需要做一些数据初始化的工作,可以如上写一个TestMain 方法,将数据初始化的工作在这里完成。
除了这些,可以看*testing.B, *testing.M 的相关方法即可。
go test -bench=.
.
go help testflag
WHY SO SLOW
- 我这里选取的是第一个数作为中位数,数据越大越可能出现倾斜,排序慢的概率也大。
- 正常的排序包中,都会在对小于等于12 个数的数组做排序时使用希尔排序,速度也有很大提升。