首頁  >  文章  >  後端開發  >  一個 Benchmark 比較分析工具

一個 Benchmark 比較分析工具

Go语言进阶学习
Go语言进阶学习轉載
2023-07-21 13:11:051007瀏覽
在 Go 中,透過撰寫 Benchmark 函數可以很方便地對某個功能點進行效能偵測。對於重要的函數,我們可以在 CI/CD 中加入對應的測試流程,當函數效能改變時能夠及時感知。那問題來了,如何偵測函數的效能變化?

換個說法,你寫了某功能函數但發現它運行很慢,需要對該函數進行最佳化,當你在Google搜尋找到更好的實作方式,透過Benchmark 函數發現它的確變快了。但你說不清楚具體變快了多少,你想知道函數優化前後的效能對比,提高多少百分點,可信度高嗎?

針對以上的需求場景,有一個工具可以幫助到你,它就是 benchstat。

Benchmark 範例

我們先回顧基準測試。為了方便理解,這裡以計算經典的計算斐波那契數列值為例。

func FibSolution(n int) int {
 if n < 2 {
  return n
 }

 return FibSolution(n-1) + FibSolution(n-2)
}

上述程式碼是遞歸式實現,很明顯,當 n 越來越大時,該函數的運行會變得非常耗時。以n 為20 為例,Benchmark 函數如下

func BenchmarkFib20(b *testing.B) {
 for i := 0; i < b.N; i++ {
  FibSolution(20)
 }
}

#命令列執行<span style="font-size: 15px;">go test -bench=BenchmarkFib20</span>#得到性能結果

BenchmarkFib20-8           39452             30229 ns/op

其中,-8 代表的是 8 cpu,函数运行次数为 39452,每次函数的平均花费时间为 30229ns。如果我们想得到多次样本数据,可以指定 go test 的 <span style="font-size: 15px;">-count=N</span> 参数。例如想得到 5 次样本数据,则执行<span style="font-size: 15px;">go test -bench=BenchmarkFib20 -count=5</span>

BenchmarkFib20-8           39325             30297 ns/op
BenchmarkFib20-8           39216             30349 ns/op
BenchmarkFib20-8           39901             30251 ns/op
BenchmarkFib20-8           39336             30455 ns/op
BenchmarkFib20-8           39423             30894 ns/op

计算斐波那契数列值的迭代式实现如下

func FibSolution(n int) int {
 if n < 2 {
  return n
 }
 p, q, r := 0, 0, 1
 for i := 2; i <= n; i++ {
  p = q
  q = r
  r = p + q
 }
 return r
}

对比这两种函数的性能差异,最朴素的方式就是分别对这两个函数进行基准测试,然后通过手工分析这些基准测试结果,但是这并不直观。

benchstat

benchstat 是 Go 官方推荐的一款命令行工具,它用于计算和比较基准测试的相关统计数据。

我们可以通过以下命令进行安装

go install golang.org/x/perf/cmd/benchstat@latest

执行 -h 参数可以看到该工具的使用描述

~ $ benchstat -h
usage: benchstat [options] old.txt [new.txt] [more.txt ...]
options:
  -alpha α
     consider change significant if p < α (default 0.05)
  -csv
     print results in CSV form
  -delta-test test
     significance test to apply to delta: utest, ttest, or none (default "utest")
  -geomean
     print the geometric mean of each file
  -html
     print results as an HTML table
  -norange
     suppress range columns (CSV only)
  -sort order
     sort by order: [-]delta, [-]name, none (default "none")
  -split labels
     split benchmarks by labels (default "pkg,goos,goarch")

我们想比较 FibSolution(n) 从 15 到 20,两种实现方式的性能基准测试。

$ go test -bench=. -count=5 | tee old.txt
$ go test -bench=. -count=5 | tee new.txt

注意,这两条命令执行时,分别对应 FibSolution 函数采用递归式和迭代式实现逻辑。

此时,我们可以对这两个函数实现逻辑进行性能对比

 $ benchstat old.txt new.txt 
name     old time/op  new time/op  delta
Fib15-8  2.67µs ± 2%  0.01µs ± 5%  -99.81%  (p=0.008 n=5+5)
Fib16-8  4.20µs ± 1%  0.01µs ± 2%  -99.87%  (p=0.008 n=5+5)
Fib17-8  6.81µs ± 0%  0.01µs ± 2%  -99.92%  (p=0.008 n=5+5)
Fib18-8  11.1µs ± 1%   0.0µs ± 1%  -99.95%  (p=0.008 n=5+5)
Fib19-8  18.0µs ± 2%   0.0µs ± 4%  -99.97%  (p=0.008 n=5+5)
Fib20-8  29.2µs ± 1%   0.0µs ± 3%  -99.98%  (p=0.008 n=5+5)

可以看到,递归式实现的函数,他的执行时间随着 n 值变大增加非常明显。迭代式实现方式,相较于递归式,它的平均时间开销降低了 99 % 以上,优化效果非常明显。

另外,p=0.008 表示结果的可信程度,p 值越大表明可信度越低。一般以 0.05 作为临界值,超过该值,则结果不可信。n=5+5 表示分别使用的有效样本数量。

總結

benchstat 是基準測試統計工具,當我們做一些最佳化工作時,可以利用它來減輕人工分析資料成本。

如果你的專案在 CI/CD 流程中有部署自動化測試,那麼不妨將該工具加入。在對函數有改動且加劇了效能損耗時,它或許能幫助你提前發現問題。


#########################

以上是一個 Benchmark 比較分析工具的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:Go语言进阶学习。如有侵權,請聯絡admin@php.cn刪除