对 Intel Sandybridge 系列 CPU 中的管道进行去优化
简介
本作业的目标是修改给定的程序以降低其性能,称为去优化。此任务需要了解英特尔 i7 管道架构以及如何重新排序指令路径以引入危险。
去优化技术
1.错误共享:
安排非原子变量存储在同一缓存行中,导致存储转发停顿。
2.存储转发停顿:
使用 XOR 翻转双精度数的符号位,而不是使用“-”运算符,强制将窄存储仅存储双精度数的一个字节。
3.内存消歧:
将数据4096B分开放置,以触发存储到不同页面的错误依赖关系。
4.未对齐的数据:
使用 __attribute__((packed)) 强制跨缓存行或页边界的变量未对齐,从而增加缓存未命中率。
5. Stride:
以 4096 字节的步幅循环数组,导致内存访问不连续,降低缓存利用率。
6.链表:
将结果存储在链表中,引入指针追逐负载依赖关系以及内存中潜在的分散节点。
基于编译器的去优化
1。原子变量:
使用std::atomic
2. Long double:
使用 long double 变量强制 x87 模拟,即使使用支持 SSE2 的 CPU。
3.整数转换:
在整数和浮点类型之间重复转换,引入高延迟的转换指令。
4.系统调用:
引入频繁的不必要的系统调用来强制上下文切换和缓存/TLB 未命中。
结论
通过采用这些技术,可以显着悲观给定的程序并使其运行速度比原始版本慢得多。成功去优化的关键是用“恶魔般的无能”而不是恶意的意图来证明每一步的合理性。
以上是我们如何故意去优化 Intel Sandybridge CPU 的程序?的详细内容。更多信息请关注PHP中文网其他相关文章!

从XML转换到C 并进行数据操作可以通过以下步骤实现:1)使用tinyxml2库解析XML文件,2)将数据映射到C 的数据结构中,3)使用C 标准库如std::vector进行数据操作。通过这些步骤,可以高效地处理和操作从XML转换过来的数据。

C#使用自动垃圾回收机制,而C 采用手动内存管理。1.C#的垃圾回收器自动管理内存,减少内存泄漏风险,但可能导致性能下降。2.C 提供灵活的内存控制,适合需要精细管理的应用,但需谨慎处理以避免内存泄漏。

C 在现代编程中仍然具有重要相关性。1)高性能和硬件直接操作能力使其在游戏开发、嵌入式系统和高性能计算等领域占据首选地位。2)丰富的编程范式和现代特性如智能指针和模板编程增强了其灵活性和效率,尽管学习曲线陡峭,但其强大功能使其在今天的编程生态中依然重要。

C 学习者和开发者可以从StackOverflow、Reddit的r/cpp社区、Coursera和edX的课程、GitHub上的开源项目、专业咨询服务以及CppCon等会议中获得资源和支持。1.StackOverflow提供技术问题的解答;2.Reddit的r/cpp社区分享最新资讯;3.Coursera和edX提供正式的C 课程;4.GitHub上的开源项目如LLVM和Boost提升技能;5.专业咨询服务如JetBrains和Perforce提供技术支持;6.CppCon等会议有助于职业

C#适合需要高开发效率和跨平台支持的项目,而C 适用于需要高性能和底层控制的应用。1)C#简化开发,提供垃圾回收和丰富类库,适合企业级应用。2)C 允许直接内存操作,适用于游戏开发和高性能计算。

C 持续使用的理由包括其高性能、广泛应用和不断演进的特性。1)高效性能:通过直接操作内存和硬件,C 在系统编程和高性能计算中表现出色。2)广泛应用:在游戏开发、嵌入式系统等领域大放异彩。3)不断演进:自1983年发布以来,C 持续增加新特性,保持其竞争力。

C 和XML的未来发展趋势分别为:1)C 将通过C 20和C 23标准引入模块、概念和协程等新特性,提升编程效率和安全性;2)XML将继续在数据交换和配置文件中占据重要地位,但会面临JSON和YAML的挑战,并朝着更简洁和易解析的方向发展,如XMLSchema1.1和XPath3.1的改进。

现代C 设计模式利用C 11及以后的新特性实现,帮助构建更灵活、高效的软件。1)使用lambda表达式和std::function简化观察者模式。2)通过移动语义和完美转发优化性能。3)智能指针确保类型安全和资源管理。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

Atom编辑器mac版下载
最流行的的开源编辑器

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

WebStorm Mac版
好用的JavaScript开发工具