使用Go defer時要注意這兩處！-Golang-PHP中文網

在 Go 語言中 defer 是一個非常有趣的關鍵字特性。例子如下：

package main

import "fmt"

func main() {
    defer fmt.Println("煎鱼了")

    fmt.Println("脑子进")
}

輸出結果是：

脑子进
煎鱼了

在前幾天我的讀者群內有小夥伴討論起了下面這個問題：

使用Go defer時要注意這兩處！

簡單來講，問題就是針對在for 迴圈裡搞defer 關鍵字，是否會造成什麼效能影響？

因為在Go 語言的底層資料結構設計上defer 是鍊錶的資料結構：

使用Go defer時要注意這兩處！

大家擔心如果循環過大defer 鍊錶會巨長，不夠「精益求精」。又或是猜想會不會 Go defer 的設計和 Redis 資料結構設計類似，自己做了優化，其實沒啥大影響？

今天這篇文章，我們就來探索循環 Go defer，造成底層鍊錶過長會不會帶來什麼問題，若有，具體有什麼影響？

開始吸魚之路。

defer 效能最佳化30%

在早年Go1.13 時曾經對defer 進行了一輪效能最佳化，在大部分場景下提高了defer 30% 的效能：

使用Go defer時要注意這兩處！

我們來回顧一下Go1.13 的變更，看看Go defer 優化在了哪裡，這是問題的關鍵點。

以前和現在比較

在Go1.12 及以前，呼叫Go defer 時彙編程式碼如下：

    0x0070 00112 (main.go:6)    CALL    runtime.deferproc(SB)
    0x0075 00117 (main.go:6)    TESTL    AX, AX
    0x0077 00119 (main.go:6)    JNE    137
    0x0079 00121 (main.go:7)    XCHGL    AX, AX
    0x007a 00122 (main.go:7)    CALL    runtime.deferreturn(SB)
    0x007f 00127 (main.go:7)    MOVQ    56(SP), BP

在Go1.13 及以後，呼叫Go defer 時彙編程式碼如下：

    0x006e 00110 (main.go:4)    MOVQ    AX, (SP)
    0x0072 00114 (main.go:4)    CALL    runtime.deferprocStack(SB)
    0x0077 00119 (main.go:4)    TESTL    AX, AX
    0x0079 00121 (main.go:4)    JNE    139
    0x007b 00123 (main.go:7)    XCHGL    AX, AX
    0x007c 00124 (main.go:7)    CALL    runtime.deferreturn(SB)
    0x0081 00129 (main.go:7)    MOVQ    112(SP), BP

從彙編的角度來看，像是原本呼叫runtime.deferproc 方法改成了呼叫runtime.deferprocStack 方法，難道做了什麼優化？

我們抱著疑問繼續看下去。

defer 最小單元：_defer

相較於先前的版本，Go defer 的最小單元_defer 結構體主要是新增了heap字段：

type _defer struct {
    siz     int32
    siz     int32 // includes both arguments and results
    started bool
    heap    bool
    sp      uintptr // sp at time of defer
    pc      uintptr
    fn      *funcval
    ...

該字段用於標識這個_defer 是在堆上，還是在堆疊上進行分配，其餘字段並沒有明確變更，那我們可以把聚焦點放在defer 的堆疊分配上了，看看做了什麼事。

deferprocStack

func deferprocStack(d *_defer) {
    gp := getg()
    if gp.m.curg != gp {
        throw("defer on system stack")
    }
    
    d.started = false
    d.heap = false
    d.sp = getcallersp()
    d.pc = getcallerpc()

    *(*uintptr)(unsafe.Pointer(&d._panic)) = 0
    *(*uintptr)(unsafe.Pointer(&d.link)) = uintptr(unsafe.Pointer(gp._defer))
    *(*uintptr)(unsafe.Pointer(&gp._defer)) = uintptr(unsafe.Pointer(d))

    return0()
}

這塊程式碼挺常規的，主要是取得呼叫defer 函數的函數堆疊指標、傳入函數的參數具體位址以及PC（程式計數器），這塊在前文《深入理解Go defer》有詳細介紹過，這裡就不再贅述了。

這個 deferprocStack 特殊在哪呢？

可以看到它把d.heap 設定為了false，也就是代表deferprocStack 方法是針對將_defer 分配在堆疊上的應用場景的。

deferproc

問題來了，它又在哪裡處理分配到堆上的應用場景？

func newdefer(siz int32) *_defer {
    ...
    d.heap = true
    d.link = gp._defer
    gp._defer = d
    return d
}

具體的newdefer 是在哪裡呼叫的呢，如下：

func deferproc(siz int32, fn *funcval) { // arguments of fn follow fn
    ...
    sp := getcallersp()
    argp := uintptr(unsafe.Pointer(&fn)) + unsafe.Sizeof(fn)
    callerpc := getcallerpc()

    d := newdefer(siz)
    ...
}

非常明確，先前的版本中呼叫的deferproc 方法，現在被用來對應分配到堆上的場景了。

小結

可以確定的是 deferproc 並沒有被去掉，而是流程被最佳化了。
Go 編譯器會根據應用程式場景去選擇使用 deferproc 或 deferprocStack 方法，他們分別是針對分配在堆上和堆疊上的使用場景。

優化在哪裡

主要最佳化在於其defer 物件的堆疊分配規則的改變，措施是：
編譯器對defer 的for-loop 迭代深度進行分析。

// src/cmd/compile/internal/gc/esc.go
case ODEFER:
    if e.loopdepth == 1 { // top level
        n.Esc = EscNever // force stack allocation of defer record (see ssa.go)
        break
    }

如果 Go 編譯器偵測到循環深度（loopdepth）為 1，則設定逃逸分析的結果，將分配到堆疊上，否則分配到堆疊上。

// src/cmd/compile/internal/gc/ssa.go
case ODEFER:
    d := callDefer
    if n.Esc == EscNever {
        d = callDeferStack
    }
    s.call(n.Left, d)

以此免去了先前頻繁呼叫 systemstack、mallocgc 等方法所帶來的大量效能開銷，來達到大部分場景提高效能的作用。

循環呼叫 defer

回到問題本身，知道了 defer 最佳化的原理後。那「循環裡搞defer 關鍵字，是否會造成什麼效能影響？」

最直接的影響就是這大約30% 的效能優化直接全無，且由於姿勢不正確，理論上defer 既有的開銷（鍊錶變長）也變大，效能變差。

因此我們要避免以下兩個場景的程式碼：

显式循环：在调用 defer 关键字的外层有显式的循环调用，例如：for-loop 语句等。
隐式循环：在调用 defer 关键字有类似循环嵌套的逻辑，例如：goto 语句等。

显式循环

第一个例子是直接在代码的 for 循环中使用 defer 关键字：

func main() {
    for i := 0; i <p>这个也是最常见的模式，无论是写爬虫时，又或是 Goroutine 调用时，不少人都喜欢这么写。</p><p>这属于显式的调用了循环。</p><h3>隐式循环</h3><p>第二个例子是在代码中使用类似 <code>goto</code> 关键字：</p><pre class="brush:php;toolbar:false">func main() {
    i := 1
food:
    defer func() {}()
    if i == 1 {
        i -= 1
        goto food
    }
}

这种写法比较少见，因为 goto 关键字有时候甚至会被列为代码规范不给使用，主要是会造成一些滥用，所以大多数就选择其实方式实现逻辑。

这属于隐式的调用，造成了类循环的作用。

总结

显然，Defer 在设计上并没有说做的特别的奇妙。他主要是根据实际的一些应用场景进行了优化，达到了较好的性能。

虽然本身 defer 会带一点点开销，但并没有想象中那么的不堪使用。除非你 defer 所在的代码是需要频繁执行的代码，才需要考虑去做优化。

否则没有必要过度纠结，在实际上，猜测或遇到性能问题时，看看 PProf 的分析，看看 defer 是不是在相应的 hot path 之中，再进行合理优化就好。

所谓的优化，可能也只是去掉 defer 而采用手动执行，并不复杂。在编码时避免踩到 defer 的显式和隐式循环这 2 个雷区就可以达到性能最大化了。

更多golang相关技术文章，请访问golang教程栏目！

以上是使用Go defer時要注意這兩處！的詳細內容。更多資訊請關注PHP中文網其他相關文章！