Heim >Backend-Entwicklung >Golang >Die zugrunde liegende Implementierung des Go-Funktionsabschlusses

Die zugrunde liegende Implementierung des Go-Funktionsabschlusses

Go语言进阶学习nach vorne: 2023-07-25 15:18:341443Durchsuche

Funktionsabschluss ist für die meisten Leser kein fortgeschrittenes Vokabular. Was ist also ein Abschluss? Hier ist ein Auszug aus der Definition im Wiki:

Ein Abschluss ist ein Datensatz, der eine Funktion zusammen mit einer Umgebung speichert. Die Umgebung ist eine Zuordnung, die jede freie Variable der Funktion verknüpft (Variablen, die lokal verwendet, aber in definiert werden). ein umschließender Bereich) mit dem Wert oder Verweis, an den der Name gebunden war, als der Abschluss erstellt wurde.

Kurz gesagt ist ein Abschluss eine Entität, die aus einer Funktion und einer Referenzumgebung besteht. Im Implementierungsprozess werden Abschlüsse häufig durch den Aufruf externer Funktionen und die Rückgabe ihrer internen Funktionen implementiert. Unter diesen bezieht sich die Referenzumgebung auf die Zuordnung freier Variablen in der externen Funktion (von der internen Funktion verwendet, aber in der externen Funktion definiert). Die interne Funktion führt externe freie Variablen ein, sodass diese Variablen nicht freigegeben oder gelöscht werden, selbst wenn sie die Umgebung der externen Funktion verlassen. Die zurückgegebene interne Funktion enthält weiterhin diese Informationen.

Die zugrunde liegende Implementierung des Go-Funktionsabschlusses

Diese Passage ist möglicherweise nicht leicht zu verstehen, also verwenden wir einfach ein Beispiel.

 1package main
 2
 3import "fmt"
 4
 5func outer() func() int {
 6    x := 1
 7    return func() int {
 8        x++
 9        return x
10    }
11}
12
13func main() {
14    closure := outer()
15    fmt.Println(closure())
16    fmt.Println(closure())
17}
18
19// output
202
213

Wie Sie sehen können, erleichtern zwei Funktionen in Go (Funktionen sind erstklassige Bürger und Unterstützung für anonyme Funktionen) die Implementierung von Abschlüssen.

Im obigen Beispiel <code style="font-size: inherit;line-height: inherit;overflow-wrap: break-word;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;color: rgb(233, 105, 0);background: rgb(248, 248, 248);">closure是闭包函数，变量x就是引用环境，它们的组合就是闭包实体。x本是outer函数之内，匿名函数之外的局部变量。在正常函数调用结束之后，x就会随着函数栈的销毁而销毁。但是由于匿名函数的引用，outer返回的函数对象会一直持有x变量。这造成了每次调用闭包<code style="font-size: inherit;line-height: inherit;overflow-wrap: break-word;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;color: rgb(233, 105, 0);background: rgb(248, 248, 248);">closure，x变量都会得到累加。

这里和普通的函数调用不一样：局部变量xclosure ist die Abschlussfunktion und die Variable x ist die Referenz Ihre Kombination ist eine Abschlusseinheit.

<p style="font-size: inherit;color: inherit;line-height: inherit;margin-top: 1.5em;margin-bottom: 1.5em;">x<span style="font-size: 15px;letter-spacing: 1px;"></span></p>

Das istouter🎜🎜Lokale Variablen innerhalb von Funktionen und außerhalb anonymer Funktionen. Nachdem der normale Funktionsaufruf beendet ist, 🎜🎜x🎜🎜 wird zerstört, wenn der Funktionsstapel zerstört wird. Aber aufgrund der Referenz der anonymen Funktion, 🎜🎜outer🎜🎜Das zurückgegebene Funktionsobjekt wird immer gehalten🎜 🎜x🎜🎜 Variable. Dies führt bei jedem Aufruf des Abschlusses zu 🎜🎜closure🎜🎜, 🎜🎜x🎜🎜Variablen werden akkumuliert. 🎜🎜🎜🎜Dies unterscheidet sich von gewöhnlichen Funktionsaufrufen: lokale Variablen🎜🎜x🎜🎜 folgt nicht der Funktion Anruf wird beendet und verschwindet. Warum ist das so? 🎜🎜🎜🎜🎜🎜🎜

实现原理

我们不妨从汇编入手，将上述代码稍微修改一下

 1package main
 2
 3func outer() func() int {
 4    x := 1
 5    return func() int {
 6        x++
 7        return x
 8    }
 9}
10
11func main() {
12    _ := outer()
13}

得到编译后的汇编语句如下。

 1$ go tool compile -S -N -l main.go 
 2"".outer STEXT size=181 args=0x8 locals=0x28
 3        0x0000 00000 (main.go:3)        TEXT    "".outer(SB), ABIInternal, $40-8
 4        ...
 5        0x0021 00033 (main.go:3)        MOVQ    $0, "".~r0+48(SP)
 6        0x002a 00042 (main.go:4)        LEAQ    type.int(SB), AX
 7        0x0031 00049 (main.go:4)        MOVQ    AX, (SP)
 8        0x0035 00053 (main.go:4)        PCDATA  $1, $0
 9        0x0035 00053 (main.go:4)        CALL    runtime.newobject(SB)
10        0x003a 00058 (main.go:4)        MOVQ    8(SP), AX
11        0x003f 00063 (main.go:4)        MOVQ    AX, "".&x+24(SP)
12        0x0044 00068 (main.go:4)        MOVQ    $1, (AX)
13        0x004b 00075 (main.go:5)        LEAQ    type.noalg.struct { F uintptr; "".x *int }(SB), AX
14        0x0052 00082 (main.go:5)        MOVQ    AX, (SP)
15        0x0056 00086 (main.go:5)        PCDATA  $1, $1
16        0x0056 00086 (main.go:5)        CALL    runtime.newobject(SB)
17        0x005b 00091 (main.go:5)        MOVQ    8(SP), AX
18        0x0060 00096 (main.go:5)        MOVQ    AX, ""..autotmp_4+16(SP)
19        0x0065 00101 (main.go:5)        LEAQ    "".outer.func1(SB), CX
20        0x006c 00108 (main.go:5)        MOVQ    CX, (AX)
21        ...

首先，我们发现不一样的是 x:=1 会调用 runtime.newobject 函数（内置new函数的底层函数，它返回数据类型指针）。在正常函数局部变量的定义时，例如

 1package main
 2
 3func add() int {
 4    x := 100
 5    x++
 6    return x
 7}
 8
 9func main() {
10    _ = add()
11}

我们能发现 x:=100 是不会调用 runtime.newobject 函数的，它对应的汇编是如下

1"".add STEXT nosplit size=58 args=0x8 locals=0x10
2        0x0000 00000 (main.go:3)        TEXT    "".add(SB), NOSPLIT|ABIInternal, $16-8
3        ...
4        0x000e 00014 (main.go:3)        MOVQ    $0, "".~r0+24(SP)
5        0x0017 00023 (main.go:4)        MOVQ    $100, "".x(SP)  // x:=100
6        0x001f 00031 (main.go:5)        MOVQ    $101, "".x(SP)
7        0x0027 00039 (main.go:6)        MOVQ    $101, "".~r0+24(SP)
8        ...

留着疑问，继续往下看。我们发现有以下语句

1        0x004b 00075 (main.go:5)        LEAQ    type.noalg.struct { F uintptr; "".x *int }(SB), AX
2        0x0052 00082 (main.go:5)        MOVQ    AX, (SP)
3        0x0056 00086 (main.go:5)        PCDATA  $1, $1
4        0x0056 00086 (main.go:5)        CALL    runtime.newobject(SB)

我们看到 type.noalg.struct { F uintptr; "".x *int }(SB)，这其实就是定义的一个闭包数据类型，它的结构表示如下

1type closure struct {
2    F uintptr   // 函数指针，代表着内部匿名函数
3    x *int      // 自由变量x，代表着对外部环境的引用
4}

之后，在通过 runtime.newobject 函数创建了闭包对象。而且由于 LEAQ xxx yyy代表的是将 xxx 指针，传递给 yyy，因此 outer 函数最终的返回，其实是闭包结构体对象指针。在《详解逃逸分析》一文中，我们详细地描述了Go编译器的逃逸分析机制，对于这种函数返回暴露给外部指针的情况，很明显，闭包对象会被分配至堆上，变量x也会随着对象逃逸至堆。这就很好地解释了为什么x变量没有随着函数栈的销毁而消亡。

我们可以通过逃逸分析来验证我们的结论

 1$  go build -gcflags &#39;-m -m -l&#39; main.go
 2# command-line-arguments
 3./main.go:6:3: outer.func1 capturing by ref: x (addr=true assign=true width=8)
 4./main.go:5:9: func literal escapes to heap:
 5./main.go:5:9:   flow: ~r0 = &{storage for func literal}:
 6./main.go:5:9:     from func literal (spill) at ./main.go:5:9
 7./main.go:5:9:     from return func literal (return) at ./main.go:5:2
 8./main.go:4:2: x escapes to heap:
 9./main.go:4:2:   flow: {storage for func literal} = &x:
10./main.go:4:2:     from func literal (captured by a closure) at ./main.go:5:9
11./main.go:4:2:     from x (reference) at ./main.go:6:3
12./main.go:4:2: moved to heap: x                   // 变量逃逸
13./main.go:5:9: func literal escapes to heap       // 函数逃逸

至此，我相信读者已经明白为什么闭包能持续持有外部变量的原因了。那么，我们来思考上文中留下的疑问，为什么在x:=1 时会调用 runtime.newobject 函数。

我们将上文中的例子改为如下，即删掉 x++ 代码

 1package main
 2
 3func outer() func() int {
 4    x := 1
 5    return func() int {
 6        return x
 7    }
 8}
 9
10func main() {
11    _ = outer()
12}

此时，x:=1处的汇编代码，将不再调用 runtime.newobject 函数，通过逃逸分析也会发现将x不再逃逸，生成的闭包对象中的x的将是值类型int

1type closure struct {
2    F uintptr 
3    x int      
4}

这其实就是Go编译器做得精妙的地方：当闭包内没有对外部变量造成修改时，Go 编译器会将自由变量的引用传递优化为直接值传递，避免变量逃逸。

总结

函数闭包一点也不神秘，它就是函数和引用环境而组合的实体。在Go中，闭包在底层是一个结构体对象，它包含了函数指针与自由变量。

Der Escape-Analysemechanismus des Go-Compilers weist das Abschlussobjekt dem Heap zu, sodass die freie Variable nicht verschwindet, wenn der Funktionsstapel zerstört wird, und abhängig von der Abschlussentität immer vorhanden sein kann. Daher liegen die Vor- und Nachteile der Verwendung von Abschlüssen auf der Hand: Durch Abschlüsse kann die Verwendung globaler Variablen vermieden und stattdessen freie Variablen über einen längeren Zeitraum im Speicher gespeichert werden. Bei unsachgemäßer Verwendung kann dieses implizite Halten freier Variablen jedoch leicht zu Problemen führen Speicherverschwendung und -lecks.

In tatsächlichen Projekten gibt es nicht viele Nutzungsszenarien für Schließungen. Wenn Sie beispielsweise einen Abschluss in Ihren Code schreiben und eine von Ihnen geschriebene Rückruffunktion einen Abschluss bildet, müssen Sie natürlich vorsichtig sein, da sonst das Problem der Speichernutzung zu Problemen führen kann.

Das obige ist der detaillierte Inhalt vonDie zugrunde liegende Implementierung des Go-Funktionsabschlusses. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Dieser Artikel ist reproduziert unter:Go语言进阶学习. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Verwenden Sie die Funktion time.ParseInLocation, um eine Zeichenfolge in die Zeit in der angegebenen Zeitzone zu analysieren und Fehlerinformationen zurückzugebenNächster Artikel：Verwenden Sie die Funktion time.ParseInLocation, um eine Zeichenfolge in die Zeit in der angegebenen Zeitzone zu analysieren und Fehlerinformationen zurückzugeben

In Verbindung stehende Artikel

Mehr sehen