首页  >  文章  >  后端开发  >  为什么 Go 对于长度为 100k 的切片使用的内存比长度为 100k 的数组要少?

为什么 Go 对于长度为 100k 的切片使用的内存比长度为 100k 的数组要少?

王林
王林转载
2024-02-09 10:12:09471浏览

为什么 Go 对于长度为 100k 的切片使用的内存比长度为 100k 的数组要少?

Go语言在处理切片和数组时,对于长度为100k的切片所使用的内存要比长度为100k的数组要少。这是因为切片在底层实现中采用了指针和长度的组合,而数组则需要连续的内存空间来存储数据。由于切片的长度是可变的,所以可以动态地分配和释放内存,而数组则需要在声明时就指定固定的长度。因此,当处理大量数据时,使用切片可以更加高效地利用内存空间,减少内存的占用。这也是Go语言在处理大规模数据时的一个优势之一。

问题内容

考虑以下代码,我分配了 4000 个数组,每个数组长度为 100k:

parentmap := make(map[int][100_000]int)
    for i := 0; i < 4000; i++ {
        parentmap[i] = [100_000]int{}
        time.sleep(3 * time.millisecond)
    }

如果我在本地运行该程序并分析其内存使用情况,它会开始使用 >2gb 内存。

现在,如果我们稍微更改代码以使用数组切片(但长度也为 100k),如下所示:

parentMap := make(map[int][]int)
    for i := 0; i < 4000; i++ {
        parentMap[i] = make([]int, 100_000)
        time.Sleep(3 * time.Millisecond)
    }

在我的机器上,内存峰值约为 73mb。 这是为什么?

我认为这两个片段将使用大致相同的内存,原因如下:

  • 在这两种情况下,go 运行时都会在堆上分配 parentmap 的值。 go 这样做是因为如果它在堆栈上分配这些值,那么一旦当前函数超出范围,parentmap 的值就会全部清除。
  • 因此第一个代码段直接在堆上分配 4k 数组。
  • 并且,第二个片段在堆上分配 4k 切片标头。每个切片头都有一个指向大小为 100k 的唯一数组(也在堆上)的指针。
  • 在这两种情况下,大小为 100k 的堆上都有 4k 数组。因此,在任何一种情况下都应使用大致相等的内存量。

我读到:https://go.dev/blog/slices-intro。但找不到解释这一点的实现细节。

解决方法

带有切片的版本可能受益于延迟分配。没有任何东西会尝试写入这些片之一的数据缓冲区,因此操作系统可以自由地不为这些缓冲区实际分配内存,直到确实尝试写入。 (操作系统也可以延迟对缓冲区进行零初始化,因此不会强制分配。)

同时,带有数组的版本需要将数组实际复制到映射中,这意味着实际执行写入。即使写入的值全为零,它们仍然是写入,因此操作系统必须实际为要写入的数据分配内存。

尝试将数据写入这些切片,切片版本也应该占用千兆字节的内存。 (我认为每页内存一个值应该足够了,但是用 1s 填充切片可能会更容易。)

以上是为什么 Go 对于长度为 100k 的切片使用的内存比长度为 100k 的数组要少?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:stackoverflow.com。如有侵权,请联系admin@php.cn删除