对 Intel Sandybridge 系列 CPU 中的管道进行去优化
此作业的目标是修改给定的程序以使其运行速度较慢,同时保持相同的算法。这是为了更深入地了解英特尔 i7 流水线的运行方式以及指令路径如何重新排序以引入危险。
程序概述
该程序是对欧洲普通看涨期权和看跌期权进行定价的蒙特卡罗模拟。它使用 Box-Muller 算法生成高斯随机数并执行大量模拟来估计期权价格。
恶魔般的无能
目标是故意创建会减慢程序执行速度的不合格代码。以下是一些用“恶魔般的无能”来证明这种方法的合理性的想法:
错误共享
- 创建由多个线程访问的共享数据结构,但未正确同步。这可能会导致缓存行乒乓球和内存顺序错误推测管道清除。
存储转发停顿
- 避免使用浮点变量的“-”运算符。相反,将高字节与 0x80 进行异或以翻转符号位,从而导致存储转发停顿。
过多的时间测量
- 每次迭代的时间具有 CPUID/RDTSC 等繁重操作的主循环,它会序列化指令并停止
不利的数学运算
- 将常量乘法替换为倒数除法(“为了便于阅读”)。除法较慢且未完全流水线化。
矢量化效率低下
- 使用 AVX 对乘/平方运算进行向量化,但在调用之前无法使用 vzeroupper标量数学库函数,导致 AVXSSE 转换
数据结构
- 将 RNG 输出存储在链表或乱序遍历的数组中。对每次迭代的结果执行相同的操作并在最后求和。这引入了指针追逐加载并破坏了缓存局部性。
多线程误用
- 多线程程序,但强制两个线程共享相同的循环计数器(具有原子增量)来创建错误的共享和争用。这也引入了原子操作不必要的开销。
其他建议
- 引入不可预测的分支来创建错误预测和管道刷新。
- 使用恶魔般无能的理由来增加循环携带的依赖链的长度。
- 引入非连续内存访问模式最大限度地减少缓存利用率。
- 额外费用学分:编写自己的平方根算法来替换作业中提供的算法。
修改的影响
这些修改预计会显着通过引入管道停顿、缓存未命中和其他性能瓶颈来减慢程序的执行速度。该作业鼓励创造力和愿意探索悲观化代码同时保持原始算法的不同方法的意愿。
以上是我们如何取消优化蒙特卡洛模拟以暴露英特尔 Sandybridge 管道瓶颈?的详细内容。更多信息请关注PHP中文网其他相关文章!

C 和XML的未来发展趋势分别为:1)C 将通过C 20和C 23标准引入模块、概念和协程等新特性,提升编程效率和安全性;2)XML将继续在数据交换和配置文件中占据重要地位,但会面临JSON和YAML的挑战,并朝着更简洁和易解析的方向发展,如XMLSchema1.1和XPath3.1的改进。

现代C 设计模式利用C 11及以后的新特性实现,帮助构建更灵活、高效的软件。1)使用lambda表达式和std::function简化观察者模式。2)通过移动语义和完美转发优化性能。3)智能指针确保类型安全和资源管理。

C 多线程和并发编程的核心概念包括线程的创建与管理、同步与互斥、条件变量、线程池、异步编程、常见错误与调试技巧以及性能优化与最佳实践。1)创建线程使用std::thread类,示例展示了如何创建并等待线程完成。2)同步与互斥使用std::mutex和std::lock_guard保护共享资源,避免数据竞争。3)条件变量通过std::condition_variable实现线程间的通信和同步。4)线程池示例展示了如何使用ThreadPool类并行处理任务,提高效率。5)异步编程使用std::as

C 的内存管理、指针和模板是核心特性。1.内存管理通过new和delete手动分配和释放内存,需注意堆和栈的区别。2.指针允许直接操作内存地址,使用需谨慎,智能指针可简化管理。3.模板实现泛型编程,提高代码重用性和灵活性,需理解类型推导和特化。

C 适合系统编程和硬件交互,因为它提供了接近硬件的控制能力和面向对象编程的强大特性。1)C 通过指针、内存管理和位操作等低级特性,实现高效的系统级操作。2)硬件交互通过设备驱动程序实现,C 可以编写这些驱动程序,处理与硬件设备的通信。

C 适合构建高性能游戏和仿真系统,因为它提供接近硬件的控制和高效性能。1)内存管理:手动控制减少碎片,提高性能。2)编译时优化:内联函数和循环展开提升运行速度。3)低级操作:直接访问硬件,优化图形和物理计算。

文件操作难题的真相:文件打开失败:权限不足、路径错误、文件被占用。数据写入失败:缓冲区已满、文件不可写、磁盘空间不足。其他常见问题:文件遍历缓慢、文本文件编码不正确、二进制文件读取错误。

深入解析C语言文件操作难题前言文件操作是C语言编程中一项重要的功能。然而,它也可能是一个有挑战性的领域,尤其是在处理复杂文件结构时。本文将深入解析C语言文件操作的常见难题,并提供实战案例来阐明解决方法。打开和关闭文件打开文件时,有两种主要的模式:r(只读)和w(写只)。要打开文件,可以使用fopen()函数:FILE*fp=fopen("file.txt","r");打开文件后,必须在使用完后将其关闭,以释放资源:fclose(fp);读取和写入数据可以使


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Atom编辑器mac版下载
最流行的的开源编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

禅工作室 13.0.1
功能强大的PHP集成开发环境

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3汉化版
中文版,非常好用