剛學Go 的同學一定思考過Go 程式的啟動過程,關於這個問題可以看饒大的文章Go 程式是怎麼跑起來的。今天我們將問題縮小,來學習 Go 程式是怎麼載入啟動參數,以及如何進行參數解析。
學習過 C 語言的兒童鞋,一定對 argc 和 argv 不會陌生。
C 程式總是從主函數 main 開始執行的,而在參數的主函數中,依照慣例,會使用 argc 和 argv 的命名作為主函數參數。
其中,argc (argument count)代表的是命令列參數數,argv(argument value) 是用來存放指向參數的指標陣列。
#include <stdio.h> int main(int argc, char *argv[]) { printf("argc = %d\n",argc); printf("argv[0] = %s, argv[1] = %s, argv[2] = %s \n", argv[0], argv[1], argv[2]); return 0; }
編譯執行以上 C 程式碼,得到輸出如下
$ gcc c_main.c -o main $ ./main foo bar sss ddd argc = 5 argv[0] = ./main, argv[1] = foo, argv[2] = bar
那在 Go 語言中,又該如何取得命令列參數呢?
同C 一樣,Go 程式也是從main 主函數開始(使用者層)執行,但主函數中並沒有定義argc 和argv。
我們可以透過 os.Args 函數,取得命令列參數。
package main import ( "fmt" "os" ) func main() { for i, v := range os.Args { fmt.Printf("arg[%d]: %v\n", i, v) } }
編譯執行 Go 函數
$ go build main.go $ ./main foo bar sss ddd arg[0]: ./main arg[1]: foo arg[2]: bar arg[3]: sss arg[4]: ddd
同 C 一樣,第一個參數也是代表可執行檔。
下文我们需要展示一些 Go 汇编代码,为了方便读者理解,先通过两图了解 Go 汇编语言对 CPU 的重新抽象。
Go汇编为了简化汇编代码的编写,引入了 PC、FP、SP、SB 四个伪寄存器。
四个伪寄存器加上其它的通用寄存器就是 Go 汇编语言对 CPU 的重新抽象。当然,该抽象的结构也适用于其它非 X86 类型的体系结构。
回到正题,命令行参数的解析过程是程序启动中的一部分内容。
以 linux amd64 系统为例,Go 程序的执行入口位于<span style="font-size: 15px;">runtime/rt0_linux_amd64.s</span>
。
TEXT _rt0_amd64_linux(SB),NOSPLIT,$-8 JMP _rt0_amd64(SB)
<span style="font-size: 15px;">_rt0_amd64</span>
函数实现于 <span style="font-size: 15px;">runtime/asm_amd64.s</span>
TEXT _rt0_amd64(SB),NOSPLIT,$-8 MOVQ 0(SP), DI // argc LEAQ 8(SP), SI // argv JMP runtime·rt0_go(SB)
看到 argc 和 argv 的身影了吗?在这里,它们从栈内存分别被加载到了 DI、SI 寄存器。
<span style="font-size: 15px;">rt0_go</span>
函数完成了 runtime 的所有初始化工作,但我们这里仅关注 argc 和 argv 的处理过程。
TEXT runtime·rt0_go(SB),NOSPLIT|TOPFRAME,$0 // copy arguments forward on an even stack MOVQ DI, AX // argc MOVQ SI, BX // argv SUBQ $(4*8+7), SP // 2args 2auto ANDQ $~15, SP MOVQ AX, 16(SP) MOVQ BX, 24(SP) ... MOVL 16(SP), AX // copy argc MOVL AX, 0(SP) MOVQ 24(SP), AX // copy argv MOVQ AX, 8(SP) CALL runtime·args(SB) CALL runtime·osinit(SB) CALL runtime·schedinit(SB) ...
经过一系列操作之后,argc 和 argv 又被折腾回了栈内存 <span style="font-size: 15px;">0(SP)</span>
和 <span style="font-size: 15px;">8(SP)</span>
中。
<span style="font-size: 15px;">args</span>
函数位于<span style="font-size: 15px;">runtime/runtime1.go</span>
中
var ( argc int32 argv **byte ) func args(c int32, v **byte) { argc = c argv = v sysargs(c, v) }
在这里,argc 和 argv 分别被保存至变量<span style="font-size: 15px;">runtime.argc</span>
和<span style="font-size: 15px;">runtime.argv</span>
。
在<span style="font-size: 15px;">rt0_go</span>
函数中调用执行完<span style="font-size: 15px;">args</span>
函数后,还会执行<span style="font-size: 15px;">schedinit</span>
。
func schedinit() { ... goargs() ...
<span style="font-size: 15px;">goargs</span>
实现于<span style="font-size: 15px;">runtime/runtime1.go</span>
var argslice []string func goargs() { if GOOS == "windows" { return } argslice = make([]string, argc) for i := int32(0); i < argc; i++ { argslice[i] = gostringnocopy(argv_index(argv, i)) } }
该函数的目的是,将指向栈内存的命令行参数字符串指针,封装成 Go 的 <span style="font-size: 15px;">string</span>
类型,最终保存于<span style="font-size: 15px;">runtime.argslice</span>
。
这里有个知识点,Go 是如何将 C 字符串封装成 Go string 类型的呢?答案就在以下代码。
func gostringnocopy(str *byte) string { ss := stringStruct{str: unsafe.Pointer(str), len: findnull(str)} s := *(*string)(unsafe.Pointer(&ss)) return s } func argv_index(argv **byte, i int32) *byte { return *(**byte)(add(unsafe.Pointer(argv), uintptr(i)*sys.PtrSize)) } func add(p unsafe.Pointer, x uintptr) unsafe.Pointer { return unsafe.Pointer(uintptr(p) + x) }
此时,Go 已经将 argc 和 argv 的信息保存至<span style="font-size: 15px;">runtime.argslice</span>
中,那聪明的你一定能猜到os.Args方法就是读取的该slice。
在<span style="font-size: 15px;">os/proc.go</span>
中,是它的实现
var Args []string func init() { if runtime.GOOS == "windows" { // Initialized in exec_windows.go. return } Args = runtime_args() } func runtime_args() []string // in package runtime
而<span style="font-size: 15px;">runtime_args</span>
方法的实现是位于 <span style="font-size: 15px;">runtime/runtime.go</span>
中的<span style="font-size: 15px;">os_runtime_args</span>
函数
//go:linkname os_runtime_args os.runtime_args func os_runtime_args() []string { return append([]string{}, argslice...) }
在这里实现了<span style="font-size: 15px;">runtime.argslice</span>
的拷贝。至此,<span style="font-size: 15px;">os.Args</span>
方法最终成功加载了命令行参数 argv 信息。
本文我們介紹了Go 可以利用<span style="font-size: 15px;">os.Args</span>
##解析程式啟動時的命令列參數,並學習了它的實作過程。
在載入實現的原始碼學習中,我們發現如果從一個點出發,去追溯它的實現原理,這個過程並不復雜,希望童鞋們不要懼怕研究源碼。
os.Args<span style="font-size: 15px;"></span>
方法將命令列參數儲存在字串切片中,透過遍歷即可提取它們。但在實際開發中我們一般不會直接使用os.Args<span style="font-size: 15px;"></span>
方法,因為 Go 為我們提供了一個更好用的 flag 套件。但鑑於篇幅原因,該部分的內容以後再寫了。
以上是Go 如何實現啟動參數的載入的詳細內容。更多資訊請關注PHP中文網其他相關文章!