搜索
首页后端开发Golang优化 Go 中的内存使用:掌握数据结构对齐

内存优化对于编写高性能软件系统至关重要。当软件可使用的内存量有限时,如果内存未得到有效利用,就会出现许多问题。这就是为什么内存优化对于更好的整体性能至关重要。

Go 继承了 C 的许多优势特性,但我注意到,很大一部分使用它的人并不了解这种语言的全部功能。原因之一可能是缺乏对它在低水平上如何工作的了解,或者缺乏使用 C 或 C 等语言的经验。我提到 C 和 C 是因为 Go 的基础几乎是建立在 C/C 的精彩功能之上的。我引用 Ken Thompson 在 Google I/O 2012 上的采访绝非偶然:

对我来说,我对 Go 充满热情的原因是因为就在我们开始 Go 的同时,我阅读(或尝试阅读)C 0x 提议的标准,这是一个令人信服的标准我。

今天,我们将讨论如何优化 Go 程序,更具体地说,是如何在 Go 中使用结构体。我们先说一下什么是结构体:

结构体是一种用户定义的数据类型,它将不同类型的相关变量分组到一个名称下。

为了充分理解问题所在,我们将提到现代处理器一次不会从内存中读取 1 个字节。 CPU如何获取存储在内存中的数据或指令?

在计算机体系结构中,字是处理器可以在单个操作中处理的数据单元 - 通常是内存的最小可寻址单元。它是固定大小的位组(二进制数字)。处理器的字长决定了其有效处理数据的能力。常见的字长包括 8 位、16 位、32 位和 64 位。一些计算机处理器架构支持半字(即一个字中位数的一半)和双字(即两个连续的字)。

当今最常见的架构是 32 位和 64 位。如果您有 32 位处理器,则意味着它一次可以访问 4 个字节,这意味着字大小为 4 个字节。如果你有 64 位处理器,它一次可以访问 8 个字节,这意味着字大小为 8 个字节。

当我们将数据存储在内存中时,每个32位数据字都有一个唯一的地址,如下所示。

Optimizing Memory Usage in Go: Mastering Data Structure Alignment

图。 1 ‑ 字可寻址存储器

我们可以读取内存中的数据,并使用加载字(lw)指令将其加载到一个寄存器。

了解了上面的理论之后,我们来看看实践是什么。对于结构数据结构的描述,我将用C语言进行演示。 C 中的结构是一种复合数据类型,允许您将多个变量组合在一起并将它们存储在同一内存块中。正如我们之前所说,CPU 访问数据取决于给定的架构。 C 中的每种数据类型都有对齐要求。

所以我们有以下简单结构:

// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;


// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

现在尝试计算以下结构的大小:

结构 1 的大小 = (char Short int) 的大小 = 1 2 = 3.

结构 2 的大小 = (double int char) 的大小 = 8 4 1= 13.

使用 C 程序的实际大小可能会让您大吃一惊。

#include <stdio.h>


// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;

// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

int main()
{
    printf("sizeof(struct1_t) = %lu\n", sizeof(struct1_t));
    printf("sizeof(struct2_t) = %lu\n", sizeof(struct2_t));

    return 0;
}
</stdio.h>

输出

sizeof(struct1_t) = 4
sizeof(struct2_t) = 16

正如我们所看到的,结构的大小与我们计算的不同。

这是什么原因呢?

C 和 Go 采用一种称为“结构填充”的技术来确保数据在内存中适当对齐,由于硬件和架构的限制,这可能会显着影响性能。数据填充和对齐符合系统架构的要求,主要是通过确保数据边界与字长对齐来优化CPU访问时间。

让我们通过一个示例来说明 Go 如何处理填充和对齐,请考虑以下结构:

type Employee struct {
  IsAdmin  bool
  Id       int64
  Age      int32
  Salary   float32
}

bool 为 1 个字节,int64 为 8 个字节,int32 为 4 个字节,float32 为 4 个字节 = 17 个字节(总计)。

让我们通过检查编译的 Go 程序来验证结构大小:

package main

import (
    "fmt"
    "unsafe"
)

type Employee struct {
    IsAdmin bool
    Id      int64
    Age     int32
    Salary  float32
}

func main() {

    var emp Employee

    fmt.Printf("Size of Employee: %d\n", unsafe.Sizeof(emp))
}

输出

Size of Employee: 24

报告的大小是 24 字节,而不是 17。这种差异是由于内存对齐造成的。为了理解对齐是如何工作的,我们需要检查结构并可视化它占用的内存。

Optimizing Memory Usage in Go: Mastering Data Structure Alignment

图 2 - 未优化的内存布局

struct Employee 将消耗 8*3 = 24 个字节。你现在看到问题了,Employee的布局中有很多空洞(那些由对齐规则产生的间隙称为“填充”)。

填充优化和性能影响

了解内存对齐和填充如何影响应用程序的性能至关重要。具体来说,数据对齐会影响访问结构体中的字段所需的 CPU 周期数。这种影响主要来自 CPU 缓存效应,而不是原始时钟周期本身,因为缓存行为很大程度上取决于内存块内的数据局部性和对齐。

现代 CPU 将数据从内存提取到更快的中介(称为缓存)中,以固定大小的块(通常为 64 字节)组织。当数据在相同或更少的缓存行中良好对齐和本地化时,由于缓存加载操作减少,CPU 可以更快地访问它。

考虑以下 Go 结构来说明较差对齐与最佳对齐:

// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;


// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

对齐如何影响性能

CPU 以字大小而不是字节大小读取数据。正如我在开头所描述的,64 位系统中的一个字是 8 个字节,而 32 位系统中的一个字是 4 个字节。简而言之,CPU 以字大小的倍数读取地址。为了获取变量 PassportId,我们的 CPU 需要两个周期来访问数据,而不是一个。第一个周期将获取内存 0 到 7,后续周期将获取其余内存。这是低效的——我们需要数据结构对齐。通过简单地对齐数据,计算机确保可以在一个CPU周期内检索到var PassportId。

Optimizing Memory Usage in Go: Mastering Data Structure Alignment

图 3 - 比较内存访问效率

Padding是实现数据对齐的关键。之所以会发生填充,是因为现代 CPU 经过优化,可以从内存中的对齐地址读取数据。这种对齐方式允许 CPU 在单个操作中读取数据。

Optimizing Memory Usage in Go: Mastering Data Structure Alignment

图 4 - 简单对齐数据

如果没有填充,数据可能会错位,导致多次内存访问和性能下降。因此,虽然 padding 可能会浪费一些内存,但它可以确保您的程序高效运行。

填充优化策略

对齐结构消耗更少的内存,因为与未对齐结构相比,它具有更好的结构字段顺序。由于填充,两个 13 字节的数据结构分别变为 16 字节和 24 字节。因此,只需重新排序结构字段即可节省额外的内存。

Optimizing Memory Usage in Go: Mastering Data Structure Alignment

图 5 - 优化现场秩序

不正确对齐的数据会降低性能,因为 CPU 可能需要多个周期来访问未对齐的字段。相反,正确对齐的数据可以最大限度地减少缓存行负载,这对于性能至关重要,尤其是在内存速度成为瓶颈的系统中。

让我们做一个简单的基准来证明这一点:

#include <stdio.h>


// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;

// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

int main()
{
    printf("sizeof(struct1_t) = %lu\n", sizeof(struct1_t));
    printf("sizeof(struct2_t) = %lu\n", sizeof(struct2_t));

    return 0;
}
</stdio.h>

输出

sizeof(struct1_t) = 4
sizeof(struct2_t) = 16

如您所见,遍历对齐对象确实比遍历对齐对象花费的时间更少。

添加填充是为了确保每个结构体字段根据其需要在内存中正确排列,就像我们之前看到的那样。但是,虽然它可以实现高效访问,但如果字段排序不好,填充也会浪费空间。

了解如何正确对齐结构体字段以最大程度地减少填充导致的内存浪费对于高效内存使用非常重要,尤其是在性能关键型应用程序中。下面,我将提供一个结构对齐不良的示例,然后展示相同结构的优化版本。

在对齐不良的结构中,字段的排序不考虑其大小和对齐要求,这可能导致增加填充和增加内存使用量:

// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;


// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

总内存可能是 1 (bool) 7 (padding) 8 (float64) 4 (int32) 4 (padding) 16 (string) = 40 字节。

优化的结构按从最大到最小的顺序排列字段,显着减少或消除对额外填充的需要:

#include <stdio.h>


// structure 1
typedef struct example_1 {
    char c;
    short int s;
} struct1_t;

// structure 2
typedef struct example_2 {
    double d;
    int s;
    char c;
} struct2_t;

int main()
{
    printf("sizeof(struct1_t) = %lu\n", sizeof(struct1_t));
    printf("sizeof(struct2_t) = %lu\n", sizeof(struct2_t));

    return 0;
}
</stdio.h>

总内存将整齐地包含 8 (float64) 16 (string) 4 (int32) 1 (bool) 3 (padding) = 32 个字节。

我们来证明一下上面的内容:

sizeof(struct1_t) = 4
sizeof(struct2_t) = 16

输出

type Employee struct {
  IsAdmin  bool
  Id       int64
  Age      int32
  Salary   float32
}

将结构大小从 40 字节减少到 32 字节意味着每个 Person 实例的内存使用量减少 20%。这可以在创建或存储许多此类实例的应用程序中节省大量成本,提高缓存效率并有可能减少缓存未命中的数量。

结论

数据对齐是优化内存利用率和增强系统性能的关键因素。通过正确排列结构数据,内存使用不仅变得更加高效,而且 CPU 读取时间也变得更快,从而显着提高整体系统效率。

以上是优化 Go 中的内存使用:掌握数据结构对齐的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
Golang的影响:速度,效率和简单性Golang的影响:速度,效率和简单性Apr 14, 2025 am 12:11 AM

GoimpactsdevelopmentPositationalityThroughSpeed,效率和模拟性。1)速度:gocompilesquicklyandrunseff,ifealforlargeprojects.2)效率:效率:ITScomprehenSevestAndArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdArdEcceSteral Depentencies,增强开发的简单性:3)SimpleflovelmentIcties:3)简单性。

C和Golang:表演至关重要时C和Golang:表演至关重要时Apr 13, 2025 am 12:11 AM

C 更适合需要直接控制硬件资源和高性能优化的场景,而Golang更适合需要快速开发和高并发处理的场景。1.C 的优势在于其接近硬件的特性和高度的优化能力,适合游戏开发等高性能需求。2.Golang的优势在于其简洁的语法和天然的并发支持,适合高并发服务开发。

Golang行动:现实世界中的示例和应用程序Golang行动:现实世界中的示例和应用程序Apr 12, 2025 am 12:11 AM

Golang在实际应用中表现出色,以简洁、高效和并发性着称。 1)通过Goroutines和Channels实现并发编程,2)利用接口和多态编写灵活代码,3)使用net/http包简化网络编程,4)构建高效并发爬虫,5)通过工具和最佳实践进行调试和优化。

Golang:Go编程语言解释了Golang:Go编程语言解释了Apr 10, 2025 am 11:18 AM

Go语言的核心特性包括垃圾回收、静态链接和并发支持。1.Go语言的并发模型通过goroutine和channel实现高效并发编程。2.接口和多态性通过实现接口方法,使得不同类型可以统一处理。3.基本用法展示了函数定义和调用的高效性。4.高级用法中,切片提供了动态调整大小的强大功能。5.常见错误如竞态条件可以通过gotest-race检测并解决。6.性能优化通过sync.Pool重用对象,减少垃圾回收压力。

Golang的目的:建立高效且可扩展的系统Golang的目的:建立高效且可扩展的系统Apr 09, 2025 pm 05:17 PM

Go语言在构建高效且可扩展的系统中表现出色,其优势包括:1.高性能:编译成机器码,运行速度快;2.并发编程:通过goroutines和channels简化多任务处理;3.简洁性:语法简洁,降低学习和维护成本;4.跨平台:支持跨平台编译,方便部署。

SQL排序中ORDER BY语句结果为何有时看似随机?SQL排序中ORDER BY语句结果为何有时看似随机?Apr 02, 2025 pm 05:24 PM

关于SQL查询结果排序的疑惑学习SQL的过程中,常常会遇到一些令人困惑的问题。最近,笔者在阅读《MICK-SQL基础�...

技术栈收敛是否仅仅是技术栈选型的过程?技术栈收敛是否仅仅是技术栈选型的过程?Apr 02, 2025 pm 05:21 PM

技术栈收敛与技术选型的关系在软件开发中,技术栈的选择和管理是一个非常关键的问题。最近,有读者提出了...

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器