很多第三方的包在系统包 runtime.pprof 的技术上进行便利性封装,让整个测试过程更为方便。这里使用 github.com/pkg/profile 包进行例子展示,使用下面代码安装这个包:
$ go get github.com/pkg/profile
性能分析代码下面代码故意制造了一个性能问题,同时使用 github.com/pkg/profile 包进行性能分析。
package main import ( "github.com/pkg/profile" "time" ) func joinSlice() []string { var arr []string for i := 0; i < 100000; i++ { // 故意造成多次的切片添加(append)操作, 由于每次操作可能会有内存重新分配和移动, 性能较低 arr = append(arr, "arr") } return arr } func main() { // 开始性能分析, 返回一个停止接口 stopper := profile.Start(profile.CPUProfile, profile.ProfilePath(".")) // 在main()结束时停止性能分析 defer stopper.Stop() // 分析的核心逻辑 joinSlice() // 让程序至少运行1秒 time.Sleep(time.Second) }代码说明如下:
第 4 行,引用 github.com/pkg/profile 第三方包封装。
第 14 行,为了进行性能分析,这里在已知元素大小的情况下,还是使用 append() 函数不断地添加切片。性能较低,在实际中应该避免,这里为了性能分析,故意这样写。
第 22 行,使用 profile.Start 调用 github.com/pkg/profile 包的开启性能分析接口。这个 Start 函数的参数都是可选项,这里需要指定的分析项目是 profile.CPUProfile,也就是 CPU 耗用。profile.ProfilePath(".") 指定输出的分析文件路径,这里指定为当前文件夹。profile.Start() 函数会返回一个 Stop 接口,方便在程序结束时结束性能分析。
第 25 行,使用 defer,将性能分析在 main() 函数结束时停止。
第 28 行,开始执行分析的核心。
第 31 行,为了保证性能分析数据的合理性,分析的最短时间是 1 秒,使用 time.Sleep() 在程序结束前等待 1 秒。如果你的程序默认可以运行 1 秒以上,这个等待可以去掉。
性能分析需要可执行配合才能生成分析结果,因此使用命令行对程序进行编译,代码如下:
$ go run cpu.go $ go tool pprof --pdf cpu.pprof > cpu.pdf代码说明如下:
第 1 行运行 cpu.go ,在当前目录输出 cpu.pprof 文件。
第 2 行,使用 go tool 工具链输入 cpu.pprof ,生成 PDF 格式的输出文件,将输出文件重定向为 cpu.pdf 文件。这个过程中会调用 Graphviz 工具,Windows 下需将 Graphviz 的可执行目录添加到环境变量 PATH 中。
最终生成 cpu.pdf 文件,使用 PDF 查看器打开文件,观察后发现下图所示的某个地方可能存在瓶颈。
func joinSlice() []string { const count = 100000 var arr []string = make([]string, count) for i := 0; i < count; i++ { arr[i] = "arr" } return arr }代码说明如下:
第 5 行,将切片预分配 count 个数量,避免之前使用 append() 函数的多次分配。
第 8 行,预分配后,直接对每个元素进行直接赋值。
重新运行上面的代码进行性能分析,最终得到的 cpu.pdf 中将不会再有耗时部分。