golang：性能测试和pprof的基本使用

下面简单演示一下基本的benchmark测试和使用pprof来对程序进行性能调优的过程。

benchmark可以得到程序性能的结果，但是对其中具体的性能情况不得而知
使用go tool pprof对benchmark的结果进行详细的查阅。

首先我们随便编写一个函数，例如上面的是我写的一次比赛的里面的题目的解，目的是进行字符串替换。其中注释部分给了一个case来解释函数功能。接下来我们编写benchmark test函数，编写方式我以goland编辑器自带的generate一键生成，你也可以参照它的模板来写。

然后我们在终端里面执行

通过执行上述的命令，我们进行了benchmark test并在当前文件夹下生成了pprof分析工具所需要的evaluate.out文件。使用如下命令可以进入pprof console

然后我们使用 top10来查看耗时最高的前10部分，如下所示，其中flat是不包含内在调用的耗时，cum是包含内在调用的总耗时。可以发现match.evaluate耗时最多。

如何对耗时最多的部分进行详细的查看呢？使用list命令，可以查看该部分的详细情况。如下长图所示：

可以对上图左边会列出对于部分的flat和cum耗时，针对耗时长的部分进行优化，对算法或者数据结构进行优化。当然我们这个还不够直观，可以使用go tool pprof提供的web ui。

然后我们就可以在web本地服务器上面看到直观地调用关系图和耗时。下面截取几个常用的graph。

火焰图（flame graph）

总结：至此一个完整的流程就完成了，由简入深，先编写功能函数完成相应功能，然后进行benchmark测试得出性能结果，然后利用out文件，对代码中耗时长的部分进行优化，这里面有很多trick的技巧。比如利用top和list以及webui等工具去直观地查看耗时情况，第二步是根据第一步得到的信息去试着refine。over and over again，直到你满意为止，适度贪婪是最好的。