out."/> out.">
Heim > Artikel > Backend-Entwicklung > Warum ist das Lesen und Schreiben von Dateien in Go so viel langsamer als in Perl?
为什么 Go 中读写文件比 Perl 慢很多?这是很多开发者在使用这两种编程语言时经常遇到的问题。在这篇文章中,php小编草莓将为您解答这个问题。在比较 Go 和 Perl 读写文件的速度时,我们需要考虑到两个关键因素:语言特性和底层实现。Go 语言在文件读写方面的设计理念与 Perl 不同,这导致了它们在性能上的差异。同时,底层实现也是影响读写速度的重要因素。接下来,我们将详细分析这些因素,帮助您更好地理解为什么 Go 中读写文件比 Perl 慢很多。
我使用go是为了提高代码效率,但是当我使用go读写文件时,发现它的读写效率没有perl高。是我代码的问题还是其他原因?
构建输入文件:
# input file: for i in $(seq 1 600000) do echo server$((random%800+100)),$random,$random,$random >> sample.csv done
用perl读写文件:
time cat sample.csv | perl -ne 'chomp;print"$_"' > out.txt
real 0m0.249s user 0m0.083s sys 0m0.049s
使用 go 读写文件:
package main import ( "bufio" "fmt" "io" "os" "strings" ) func main() { filepath := "./sample.csv" file, err := os.openfile(filepath, os.o_rdwr, 0666) if err != nil { fmt.println("open file error!", err) return } defer file.close() buf := bufio.newreader(file) for { line, err := buf.readstring('\n') line = strings.trimspace(line) fmt.println(line) if err != nil { if err == io.eof { fmt.println("file read ok!") break } else { fmt.println("read file error!", err) return } } } }
然后我运行:
time go run read.go > out.txt
real 0m2.332s user 0m0.326s sys 0m2.038s
为什么 go 的读写速度比 perl 慢近 10 倍?
您正在将苹果与橙子进行比较。
至少有两个方法错误:
您的 perl 咒语测量 cat
如何读取文件并通过 pipe(2) 发送其内容
,而 perl
从那里读取数据,对其进行处理并将结果写入其标准输出。
你的围棋咒语
fmt.print*
调用),而在 perl 代码中写入标准输出 - 引用 文档 - “如果输出到终端,通常可以进行行缓冲,否则进行块缓冲。”
让我们尝试比较一下苹果。
首先,这是一个类似的 go 实现:
package main import ( "bufio" "bytes" "fmt" "os" ) func main() { in := bufio.newscanner(os.stdin) out := bufio.newwriter(os.stdout) for in.scan() { s := bytes.trimspace(in.bytes()) if _, err := out.write(s); err != nil { fmt.fprint(os.stderr, "failed to write file:", err) os.exit(1) } } if err := out.flush(); err != nil { fmt.fprint(os.stderr, "failed to write file:", err) os.exit(1) } if err := in.err(); err != nil { fmt.fprint(os.stderr, "reading failed:", err) os.exit(1) } }
让我们将其保存为 chomp.go
并进行测量:
构建代码:
$ go build chomp.go
生成输入文件:
$ for i in $(seq 1 600000);执行 echo server$((random%800+100)),$random,$random,$random;完成 >sample.csv
运行 perl 代码:
$ time { perl -ne 'chomp; print "$_";' <sample.csv >out1.txt; } real 0m0.226s user 0m0.102s sys 0m0.048s
再次运行它以确保它已从文件系统缓存中读取输入文件:
$ time { perl -ne 'chomp; print "$_";' <sample.csv >out1.txt; } real 0m0.123s user 0m0.090s sys 0m0.033s
注意执行时间是如何减少的。
在缓存的输入上运行 go 代码:
$ time { ./chomp <sample.csv >out2.txt; } real 0m0.063s user 0m0.032s sys 0m0.032s
确保结果相同:
$ cmp out1.txt out2.txt
如您所见,在我的带有 ssd 的 linux/amd64
系统上,结果大致相同。
嗯,我还应该指出,为了获得合理的结果,您需要运行每个命令,例如 1000 次,并对每个批次中的结果进行平均,然后比较这些数字,但我认为这足以证明什么您的方法存在的问题是。
还有一件事需要考虑:这两个程序的运行时间绝大多数由文件系统 i/o 主导,因此,如果您认为 go 会更快,那么您的期望是没有根据的:这两个程序大部分时间sleep 在内核的系统调用 read(2)
和 write(2)
。在某些涉及 cpu 运算的情况下,go 程序可能比 perl 程序更快(特别是如果它是为利用多核系统而编写的),但您的示例根本不是这种情况。
哦,只是为了明确未说明的事实:虽然 go 语言规范没有说明 aot,而 go run
是一种针对一次性一次性演出的 hack,不严肃的工作,也不执行任何严重复杂程度的代码。简而言之,go-that-you-are-using 并不是一种解释性语言,尽管 go run
的可用性可能使它看起来如此。事实上,它执行正常 go build
会执行的操作,然后运行生成的可执行文件,然后将其丢弃。
Man könnte versucht sein zu sagen, dass Perl auch „Quellcode“ verarbeitet, aber der Perl-Interpreter ist stark für die Verarbeitung von Skripten optimiert und die Build-Toolchain von Go ist – obwohl sie im Vergleich zu den meisten anderen kompilierten Sprachen unglaublich schnell ist – nicht dafür ausgelegt optimiert.
Der offensichtlichere Unterschied besteht wahrscheinlich darin, dass der Perl-Interpreter tatsächlich Ihr (sehr einfaches) Skript interpretiert, während die Binärdatei selbst! ); Dies ist natürlich ein sehr ressourcenintensiver Prozess und hat nichts mit der tatsächlichen Programmausführung zu tun.
Das obige ist der detaillierte Inhalt vonWarum ist das Lesen und Schreiben von Dateien in Go so viel langsamer als in Perl?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!