对 Intel Sandybridge 系列 CPU 中的管道进行去优化
简介
任务是通过利用 Intel Sandybridge 处理器来降低 Monte-Carlo 模拟程序的效率 建筑学。该处理器具有无序管道,具有寄存器重命名和存储缓冲等功能,因此降低指令级并行性 (ILP) 并引入危险具有挑战性。
程序分析
该程序是蒙特卡罗模拟,用于计算欧洲普通看涨期权和看跌期权的价格。该程序的关键组件是:
- 迭代指定次数的循环
- 高斯随机数生成
- Black-Scholes 期权定价公式
优化技术
以下技术可用于降低程序效率:
- 错误依赖关系:在指令之间引入不必要的依赖关系,以增加危险停顿。
- 内存瓶颈:导致缓存未命中和内存访问由于数据不对齐或使用非连续内存访问模式而导致延迟。
- 延迟指令:使用具有较长延迟且可能被管道延迟的指令。
- 效率较低的运算:使用效率较低的数学运算,例如除法,而不是乘法。
- 分支错误预测:引入不可预测的分支导致管道刷新。
- 存储转发停顿:使用双精度高字节异或等技术引起存储转发
- 指令缓存未命中:将例程分成小块以导致指令缓存未命中。
具体建议
基于上述技术,这里有一些悲观化的具体建议节目:
- 使用 std::atomic
; for 循环计数器并使其不对齐。 - 在非原子变量之间引入错误共享。
- 具有单个共享 std::atomic
循环计数器的多线程。 - 用关联/分配等价重写表达式以增加工作。
- 小心使用内部函数以避免管道停顿。
- 使用内联汇编来分解 uop 缓存。
- 使用 CPUID/RDTSC 来计时每次迭代并引发序列化.
- 以非连续顺序遍历数组并使用带填充和未对齐的数组元素。
- 使用 双精度 精度代替 float 来增加延迟。
- 强制从整数转换为浮点数,然后再返回。
- 使用 -O0 禁用编译器优化并使用-march=i386 用于较慢的指令。
- 经常设置不同 CPU 的 CPU 关联性。
以上是我们如何取消优化英特尔 Sandybridge 处理器的蒙特卡洛模拟?的详细内容。更多信息请关注PHP中文网其他相关文章!

本文解释了C标准模板库(STL),重点关注其核心组件:容器,迭代器,算法和函子。 它详细介绍了这些如何交互以启用通用编程,提高代码效率和可读性t

本文详细介绍了c中有效的STL算法用法。 它强调了数据结构选择(向量与列表),算法复杂性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和并行执行。 常见的陷阱

本文详细介绍了C中的有效异常处理,涵盖了尝试,捕捉和投掷机制。 它强调了诸如RAII之类的最佳实践,避免了不必要的捕获块,并为强大的代码登录例外。 该文章还解决了Perf

本文讨论了使用C中的移动语义来通过避免不必要的复制来提高性能。它涵盖了使用std :: Move的实施移动构造函数和任务运算符,并确定了关键方案和陷阱以有效

C 20范围通过表现力,合成性和效率增强数据操作。它们简化了复杂的转换并集成到现有代码库中,以提高性能和可维护性。

本文讨论了C中的动态调度,其性能成本和优化策略。它突出了动态调度会影响性能并将其与静态调度进行比较的场景,强调性能和之间的权衡

文章讨论了在C中有效使用RVALUE参考,以进行移动语义,完美的转发和资源管理,重点介绍最佳实践和性能改进。(159个字符)


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

Dreamweaver CS6
视觉化网页开发工具

WebStorm Mac版
好用的JavaScript开发工具