搜索
首页后端开发C++我们如何取消优化英特尔 Sandybridge 处理器的蒙特卡洛模拟?

How Can We Deoptimize a Monte-Carlo Simulation for Intel Sandybridge Processors?

对 Intel Sandybridge 系列 CPU 中的管道进行去优化

简介

任务是通过利用 Intel Sandybridge 处理器来降低 Monte-Carlo 模拟程序的效率 建筑学。该处理器具有无序管道,具有寄存器重命名和存储缓冲等功能,因此降低指令级并行性 (ILP) 并引入危险具有挑战性。

程序分析

该程序是蒙特卡罗模拟,用于计算欧洲普通看涨期权和看跌期权的价格。该程序的关键组件是:

  • 迭代指定次数的循环
  • 高斯随机数生成
  • Black-Scholes 期权定价公式

优化技术

以下技术可用于降低程序效率:

  • 错误依赖关系:在指令之间引入不必要的依赖关系,以增加危险停顿。
  • 内存瓶颈:导致缓存未命中和内存访问由于数据不对齐或使用非连续内存访问模式而导致延迟。
  • 延迟指令:使用具有较长延迟且可能被管道延迟的指令。
  • 效率较低的运算:使用效率较低的数学运算,例如除法,而不是乘法。
  • 分支错误预测:引入不可预测的分支导致管道刷新。
  • 存储转发停顿:使用双精度高字节异或等技术引起存储转发
  • 指令缓存未命中:将例程分成小块以导致指令缓存未命中。

具体建议

基于上述技术,这里有一些悲观化的具体建议节目:

  • 使用 std::atomic; for 循环计数器并使其不对齐。
  • 在非原子变量之间引入错误共享。
  • 具有单个共享 std::atomic 循环计数器的多线程。
  • 用关联/分配等价重写表达式以增加工作。
  • 小心使用内部函数以避免管道停顿。
  • 使用内联汇编来分解 uop 缓存。
  • 使用 CPUID/RDTSC 来计时每次迭代并引发序列化.
  • 以非连续顺序遍历数组并使用带填充和未对齐的数组元素。
  • 使用 双精度 精度代替 float 来增加延迟。
  • 强制从整数转换为浮点数,然后再返回。
  • 使用 -O0 禁用编译器优化并使用-march=i386 用于较慢的指令。
  • 经常设置不同 CPU 的 CPU 关联性。

以上是我们如何取消优化英特尔 Sandybridge 处理器的蒙特卡洛模拟?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
C标准模板库(STL)如何工作?C标准模板库(STL)如何工作?Mar 12, 2025 pm 04:50 PM

本文解释了C标准模板库(STL),重点关注其核心组件:容器,迭代器,算法和函子。 它详细介绍了这些如何交互以启用通用编程,提高代码效率和可读性t

如何有效地使用STL(排序,查找,转换等)的算法?如何有效地使用STL(排序,查找,转换等)的算法?Mar 12, 2025 pm 04:52 PM

本文详细介绍了c中有效的STL算法用法。 它强调了数据结构选择(向量与列表),算法复杂性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和并行执行。 常见的陷阱

我如何在C中有效处理异常?我如何在C中有效处理异常?Mar 12, 2025 pm 04:56 PM

本文详细介绍了C中的有效异常处理,涵盖了尝试,捕捉和投掷机制。 它强调了诸如RAII之类的最佳实践,避免了不必要的捕获块,并为强大的代码登录例外。 该文章还解决了Perf

如何使用C中的移动语义来提高性能?如何使用C中的移动语义来提高性能?Mar 18, 2025 pm 03:27 PM

本文讨论了使用C中的移动语义来通过避免不必要的复制来提高性能。它涵盖了使用std :: Move的实施移动构造函数和任务运算符,并确定了关键方案和陷阱以有效

如何在C 20中使用范围进行更有表现的数据操纵?如何在C 20中使用范围进行更有表现的数据操纵?Mar 17, 2025 pm 12:58 PM

C 20范围通过表现力,合成性和效率增强数据操作。它们简化了复杂的转换并集成到现有代码库中,以提高性能和可维护性。

动态调度如何在C中起作用,如何影响性能?动态调度如何在C中起作用,如何影响性能?Mar 17, 2025 pm 01:08 PM

本文讨论了C中的动态调度,其性能成本和优化策略。它突出了动态调度会影响性能并将其与静态调度进行比较的场景,强调性能和之间的权衡

在C中如何有效地使用RVALUE参考?在C中如何有效地使用RVALUE参考?Mar 18, 2025 pm 03:29 PM

文章讨论了在C中有效使用RVALUE参考,以进行移动语义,完美的转发和资源管理,重点介绍最佳实践和性能改进。(159个字符)

C的内存管理如何工作,包括新,删除和智能指针?C的内存管理如何工作,包括新,删除和智能指针?Mar 17, 2025 pm 01:04 PM

C内存管理使用新的,删除和智能指针。本文讨论了手册与自动化管理以及智能指针如何防止内存泄漏。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具