搜索
首页后端开发C++如何进一步优化蒙特卡洛模拟以显着减慢英特尔 Sandybridge 系列 CPU 的执行速度?

How Can a Monte Carlo Simulation Be Further Deoptimized to Significantly Slow Down Execution on an Intel Sandybridge-Family CPU?

对 Intel Sandybridge 系列 CPU 中的管道进行去优化

目标: 通过利用以下知识来悲观程序运行速度较慢英特尔 i7

问题:

作业提供了两个选项:油石或蒙特卡罗程序。学生选择了蒙特卡洛模拟程序,但他们的悲观化努力只增加了代码运行时间一秒。

问题:

学生如何进一步悲观化代码实现更有意义速度变慢?

答案:

一般策略:

  • 引入不可预测的分支来增加误预测惩罚。
  • 延长循环携带的依赖链以减少指令级别并行性。
  • 使用较慢的 FP 操作和 div,尤其是 exp 和 log 函数。

Uarch 特定想法:

具有内在函数():

  • 使用 movnti 从缓存中逐出数据。
  • 在 FP 数学运算之间使用整数洗牌以导致旁路延迟。
  • 避免混合 SSE 和 AVX 指令而不使用vzeroupper。

使用(内联)asm:

  • 强制对齐问题以破坏 uop 缓存。
  • 使用 self-修改代码以触发管道

导致缓存未命中和内存减慢:

  • 执行狭窄存储导致存储转发停顿。
  • 替换具有大结构成员的局部变量来控制内存布局。
  • 安排内存布局以增加缓存未命中和页面拆分加载。
  • 使用未对齐的变量来跨越缓存行或页面边界。
  • 以非循环方式循环数组-连续顺序。
  • 考虑使用链表而不是

其他技术:

  • 使用 std::atomic;循环计数器用于较慢的原子操作。
  • 使用 -m32 或 -march=i386 进行编译以强制减慢代码生成速度。
  • 强制使用较低精度的长双精度计算以获得额外的速度。
  • 经常将CPU亲和力设置为不同的CPU。
  • 为上下文切换实现过多的系统调用

最后的注释:

  • 虽然这些技术有效地减慢了代码的速度,但它们的“恶魔般的无能”程度取决于给出的理由.
  • 作业讲师可能想让学生了解管道危险和依赖性,而不仅仅是应用这些技术盲目地。

以上是如何进一步优化蒙特卡洛模拟以显着减慢英特尔 Sandybridge 系列 CPU 的执行速度?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
C#vs. C:编程语言的比较分析C#vs. C:编程语言的比较分析May 04, 2025 am 12:03 AM

C#和C 的主要区别在于语法、内存管理和性能:1)C#语法现代,支持lambda和LINQ,C 保留C特性并支持模板。2)C#自动内存管理,C 需要手动管理。3)C 性能优于C#,但C#性能也在优化中。

用C构建XML应用程序:实例用C构建XML应用程序:实例May 03, 2025 am 12:16 AM

在C 中处理XML数据可以使用TinyXML、Pugixml或libxml2库。1)解析XML文件:使用DOM或SAX方法,DOM适合小文件,SAX适合大文件。2)生成XML文件:将数据结构转换为XML格式并写入文件。通过这些步骤,可以有效地管理和操作XML数据。

C中的XML:处理复杂的数据结构C中的XML:处理复杂的数据结构May 02, 2025 am 12:04 AM

在C 中处理XML数据结构可以使用TinyXML或pugixml库。1)使用pugixml库解析和生成XML文件。2)处理复杂的嵌套XML元素,如书籍信息。3)优化XML处理代码,建议使用高效库和流式解析。通过这些步骤,可以高效处理XML数据。

C和性能:它仍然主导C和性能:它仍然主导May 01, 2025 am 12:14 AM

C 在性能优化方面仍然占据主导地位,因为其低级内存管理和高效执行能力使其在游戏开发、金融交易系统和嵌入式系统中不可或缺。具体表现为:1)在游戏开发中,C 的低级内存管理和高效执行能力使得它成为游戏引擎开发的首选语言;2)在金融交易系统中,C 的性能优势确保了极低的延迟和高吞吐量;3)在嵌入式系统中,C 的低级内存管理和高效执行能力使得它在资源有限的环境中非常受欢迎。

C XML框架:为您选择合适的一个C XML框架:为您选择合适的一个Apr 30, 2025 am 12:01 AM

C XML框架的选择应基于项目需求。1)TinyXML适合资源受限环境,2)pugixml适用于高性能需求,3)Xerces-C 支持复杂的XMLSchema验证,选择时需考虑性能、易用性和许可证。

C#vs. C:为您的项目选择正确的语言C#vs. C:为您的项目选择正确的语言Apr 29, 2025 am 12:51 AM

C#适合需要开发效率和类型安全的项目,而C 适合需要高性能和硬件控制的项目。 1)C#提供垃圾回收和LINQ,适用于企业应用和Windows开发。 2)C 以高性能和底层控制着称,广泛用于游戏和系统编程。

c  怎么进行代码优化c 怎么进行代码优化Apr 28, 2025 pm 10:27 PM

C 代码优化可以通过以下策略实现:1.手动管理内存以优化使用;2.编写符合编译器优化规则的代码;3.选择合适的算法和数据结构;4.使用内联函数减少调用开销;5.应用模板元编程在编译时优化;6.避免不必要的拷贝,使用移动语义和引用参数;7.正确使用const帮助编译器优化;8.选择合适的数据结构,如std::vector。

如何理解C  中的volatile关键字?如何理解C 中的volatile关键字?Apr 28, 2025 pm 10:24 PM

C 中的volatile关键字用于告知编译器变量值可能在代码控制之外被改变,因此不能对其进行优化。1)它常用于读取可能被硬件或中断服务程序修改的变量,如传感器状态。2)volatile不能保证多线程安全,应使用互斥锁或原子操作。3)使用volatile可能导致性能slight下降,但确保程序正确性。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具