我痴迷于计算机科学与软件工程的方方面面,尤其对底层编程情有独钟。探索软件与硬件的交互机制,分析其边界行为,着实令人着迷。即使在高级应用编程中,这些知识也能帮助调试和解决问题,例如堆栈内存的运用。理解堆栈内存的工作原理,特别是与硬件交互时,对于避免和调试问题至关重要。
本文将探讨程序中频繁的函数调用如何导致开销并降低性能。阅读本文需要您具备一定的堆栈和堆内存以及CPU寄存器知识基础。
什么是堆栈框架?
假设您在计算机上运行一个程序。操作系统调用调度程序,为您的程序分配内存,并准备CPU执行指令。这部分保留的内存就是程序分配堆栈内存的地方。大多数系统中,每个线程的默认最大堆栈大小为8MB。
如果您使用Linux或Unix系统,可以使用以下命令查看此值:
ulimit -s
堆栈内存用于保存传递给程序的参数,为局部变量分配内存,并存储程序的执行上下文。堆栈内存与堆内存的主要区别在于堆栈速度更快。由于堆栈内存由操作系统在程序执行开始时预先分配,因此无需每次分配内存时都调用操作系统。代码只需更新堆栈顶部指针指向的内存地址,然后继续执行。这使得堆栈非常适合存储小型、生命周期短的数据(如局部变量),而较大的或生命周期长的数据则通过系统调用在堆中分配。在程序执行过程中,会调用许多函数。例如,考虑以下代码片段:
#include <stdio.h> int sum(int a, int b) { return a + b; } int main() { int a = 1, b = 3; int result; result = sum(a, b); printf("%d\n", result); return 0; }
调用
sum
函数时,CPU必须将执行上下文从main
函数切换到sum
函数。这需要CPU花费周期来准备执行新的指令。具体来说,它必须:>保存CPU寄存器的当前值到堆栈内存中。>保存下一条指令的内存地址(以便从sum
函数返回后恢复main
函数的执行)。>更改程序计数器(PC)指向sum
函数的第一条指令。>存储函数参数(这可能涉及将参数放入寄存器或堆栈中,取决于调用约定)。
这个保存数据集合被称为堆栈框架。每次调用函数时,都会创建一个新的堆栈帧,函数执行完毕后,会反向执行此过程,恢复之前的执行上下文。
性能影响 如前所述,函数调用和返回会引入CPU开销。在包含频繁函数调用或深度递归的循环等场景中,这种开销尤为明显,堆栈框架的管理成为工作负载的重要组成部分。
对于性能要求苛刻的应用,例如嵌入式软件或游戏开发,C语言提供了一些工具来最大限度地减少这种开销。例如,可以使用宏或inline
关键字来减少函数调用开销。示例如下:
static inline int sum(int a, int b) { return a + b; }
或者使用宏:
#define sum(a, b) ((a) + (b))
这两种方法都避免了创建堆栈帧的开销,但内联函数更可取,因为它提供类型安全,而宏可能会引入细微的错误(例如,多次计算参数)。需要注意的是,现代编译器高度优化,经常自动内联函数,尤其是在使用
-O2
或-O3
优化级别时。除非您在对每个周期都至关重要的嵌入式系统中工作,否则通常不需要显式使用内联或宏。
实用见解
为了说明底层机制,您可以检查简单的函数调用(例如本文开头提供的sum
函数)生成的汇编代码。使用objdump
或gdb
,您可以看到CPU如何管理寄存器和堆栈:
0000000000001149 <sum>: 1149: f3 0f 1e fa endbr64 # Indirect branch protection (may vary by system) 114d: 55 push %rbp # Save base pointer 114e: 48 89 e5 mov %rsp,%rbp # Set new base pointer 1151: 89 7d fc mov %edi,-0x4(%rbp) # Save first argument (a) on the stack 1154: 89 75 f8 mov %esi,-0x8(%rbp) # Save second argument (b) on the stack 1157: 8b 55 fc mov -0x4(%rbp),%edx # Load first argument (a) from the stack 115a: 8b 45 f8 mov -0x8(%rbp),%eax # Load second argument (b) from the stack 115d: 01 d0 add %edx,%eax # Add the two arguments 115f: 5d pop %rbp # Restore base pointer 1160: c3 ret # Return to the caller </sum>
这里可以看到设置和拆除堆栈框架(
push
,mov
,pop
)以及实际计算(add
)的指令。每个函数调用都会增加类似的指令序列,从而导致开销。
何时优化至关重要
现代CPU每秒执行万亿次操作,在大多数情况下,函数调用的性能影响可以忽略不计。但在某些领域(例如嵌入式系统或计算密集型应用),这些优化至关重要。例如,嵌入式处理器的性能和内存通常有限,使得堆栈管理开销更大。同样,优化函数调用可以减少实时系统中的延迟或加快资源密集型模拟中的数学计算。 然而,本文并不建议为了性能而牺牲代码可读性。其目的是阐明程序运行时的底层机制。
The above is the detailed content of Stack Framework and Function Calls: How to Create a CPU Overhead. For more information, please follow other related articles on the PHP Chinese website!

linux设备节点是应用程序和设备驱动程序沟通的一个桥梁;设备节点被创建在“/dev”,是连接内核与用户层的枢纽,相当于硬盘的inode一样的东西,记录了硬件设备的位置和信息。设备节点使用户可以与内核进行硬件的沟通,读写设备以及其他的操作。

区别:1、open是UNIX系统调用函数,而fopen是ANSIC标准中的C语言库函数;2、open的移植性没fopen好;3、fopen只能操纵普通正规文件,而open可以操作普通文件、网络套接字等;4、open无缓冲,fopen有缓冲。

端口映射又称端口转发,是指将外部主机的IP地址的端口映射到Intranet中的一台计算机,当用户访问外网IP的这个端口时,服务器自动将请求映射到对应局域网内部的机器上;可以通过使用动态或固定的公共网络IP路由ADSL宽带路由器来实现。

在linux中,eof是自定义终止符,是“END Of File”的缩写;因为是自定义的终止符,所以eof就不是固定的,可以随意的设置别名,linux中按“ctrl+d”就代表eof,eof一般会配合cat命令用于多行文本输出,指文件末尾。

在linux中,可以利用“rpm -qa pcre”命令判断pcre是否安装;rpm命令专门用于管理各项套件,使用该命令后,若结果中出现pcre的版本信息,则表示pcre已经安装,若没有出现版本信息,则表示没有安装pcre。

linux查询mac地址的方法:1、打开系统,在桌面中点击鼠标右键,选择“打开终端”;2、在终端中,执行“ifconfig”命令,查看输出结果,在输出信息第四行中紧跟“ether”单词后的字符串就是mac地址。

手机远程linux工具有:1、JuiceSSH,是一款功能强大的安卓SSH客户端应用,可直接对linux服务进行管理;2、Termius,可以利用手机来连接Linux服务器;3、Termux,一个强大的远程终端工具;4、向日葵远程控制等等。

在linux中,rpc是远程过程调用的意思,是Reomote Procedure Call的缩写,特指一种隐藏了过程调用时实际通信细节的IPC方法;linux中通过RPC可以充分利用非共享内存的多处理器环境,提高系统资源的利用率。


Hot AI Tools

Undresser.AI Undress
AI-powered app for creating realistic nude photos

AI Clothes Remover
Online AI tool for removing clothes from photos.

Undress AI Tool
Undress images for free

Clothoff.io
AI clothes remover

AI Hentai Generator
Generate AI Hentai for free.

Hot Article

Hot Tools

SublimeText3 English version
Recommended: Win version, supports code prompts!

mPDF
mPDF is a PHP library that can generate PDF files from UTF-8 encoded HTML. The original author, Ian Back, wrote mPDF to output PDF files "on the fly" from his website and handle different languages. It is slower than original scripts like HTML2FPDF and produces larger files when using Unicode fonts, but supports CSS styles etc. and has a lot of enhancements. Supports almost all languages, including RTL (Arabic and Hebrew) and CJK (Chinese, Japanese and Korean). Supports nested block-level elements (such as P, DIV),

SAP NetWeaver Server Adapter for Eclipse
Integrate Eclipse with SAP NetWeaver application server.

SublimeText3 Mac version
God-level code editing software (SublimeText3)

MantisBT
Mantis is an easy-to-deploy web-based defect tracking tool designed to aid in product defect tracking. It requires PHP, MySQL and a web server. Check out our demo and hosting services.