搜索
首页后端开发C++x86_64 是否支持双精度和 SSE/AVX 向量上的原子操作?

Does x86_64 Support Atomic Operations on Doubles and SSE/AVX Vectors?

x86_64 上的原子浮点运算和 SSE/AVX 矢量加载/存储

虽然 C 11 支持无锁 std::atomic,但它确实支持由于 CPU 依赖性,当前不支持原子 AVX/SSE 向量。然而,问题出现了:x86_64 是否为双精度或向量上的原子操作提供汇编级支持?

x86_64 上的原子操作

x86_64 支持以下对双精度的原子操作,使用锁执行 -自由的说明:

  • 加载
  • 存储

原子向量运算x86_64

不幸的是,无法保证 128b 或 256b 向量在缓存一致性系统中存储或加载的原子性。但是,对于对齐向量,您可以安全地在共享双精度数组上使用向量加载和存储,而无需担心撕裂的风险。

如果需要原子 16B 加载,则唯一的选择是使用带有desired=expected 的锁 cmpxchg16b。如果成功,它将用自身替换现有值。如果失败,您将获得旧内容。请注意,此“加载”会在只读内存上出现错误,因此在将指针传递给执行此操作的函数时要小心。

原子 16B 存储和 RMW 都可以以明显的方式使用锁 cmpxchg16b。这使得纯存储比常规向量存储昂贵得多,尤其是在多次重试 cmpxchg16b 的情况下。然而,原子 RMW 已经很昂贵了。

原子向量运算的局限性

  • 原子<__m128d>由于使用 cmpxchg16b,即使对于只读或只写操作也会很慢。
  • atomic<__m256d>不能是无锁的。
  • alignas(64)atomic共享缓冲区[1024];将允许自动矢量化,但编译器不会为此生成有效的 asm。

原子读取和更新 16B 对象

您可以原子更新 16B 对象,但单独读取 8B 一半。然而,编译器没有提供一种干净的方式来表达这一点,并且由于编译器开发人员不断的考虑,内联 cmpxchg16b 是不可靠的。

以上是x86_64 是否支持双精度和 SSE/AVX 向量上的原子操作?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
c#vs. c:每种语言都擅长c#vs. c:每种语言都擅长Apr 12, 2025 am 12:08 AM

C#适合需要高开发效率和跨平台支持的项目,而C 适用于需要高性能和底层控制的应用。1)C#简化开发,提供垃圾回收和丰富类库,适合企业级应用。2)C 允许直接内存操作,适用于游戏开发和高性能计算。

继续使用C:耐力的原因继续使用C:耐力的原因Apr 11, 2025 am 12:02 AM

C 持续使用的理由包括其高性能、广泛应用和不断演进的特性。1)高效性能:通过直接操作内存和硬件,C 在系统编程和高性能计算中表现出色。2)广泛应用:在游戏开发、嵌入式系统等领域大放异彩。3)不断演进:自1983年发布以来,C 持续增加新特性,保持其竞争力。

C和XML的未来:新兴趋势和技术C和XML的未来:新兴趋势和技术Apr 10, 2025 am 09:28 AM

C 和XML的未来发展趋势分别为:1)C 将通过C 20和C 23标准引入模块、概念和协程等新特性,提升编程效率和安全性;2)XML将继续在数据交换和配置文件中占据重要地位,但会面临JSON和YAML的挑战,并朝着更简洁和易解析的方向发展,如XMLSchema1.1和XPath3.1的改进。

现代C设计模式:构建可扩展和可维护的软件现代C设计模式:构建可扩展和可维护的软件Apr 09, 2025 am 12:06 AM

现代C 设计模式利用C 11及以后的新特性实现,帮助构建更灵活、高效的软件。1)使用lambda表达式和std::function简化观察者模式。2)通过移动语义和完美转发优化性能。3)智能指针确保类型安全和资源管理。

C多线程和并发:掌握并行编程C多线程和并发:掌握并行编程Apr 08, 2025 am 12:10 AM

C 多线程和并发编程的核心概念包括线程的创建与管理、同步与互斥、条件变量、线程池、异步编程、常见错误与调试技巧以及性能优化与最佳实践。1)创建线程使用std::thread类,示例展示了如何创建并等待线程完成。2)同步与互斥使用std::mutex和std::lock_guard保护共享资源,避免数据竞争。3)条件变量通过std::condition_variable实现线程间的通信和同步。4)线程池示例展示了如何使用ThreadPool类并行处理任务,提高效率。5)异步编程使用std::as

C深度潜水:掌握记忆管理,指针和模板C深度潜水:掌握记忆管理,指针和模板Apr 07, 2025 am 12:11 AM

C 的内存管理、指针和模板是核心特性。1.内存管理通过new和delete手动分配和释放内存,需注意堆和栈的区别。2.指针允许直接操作内存地址,使用需谨慎,智能指针可简化管理。3.模板实现泛型编程,提高代码重用性和灵活性,需理解类型推导和特化。

C和系统编程:低级控制和硬件交互C和系统编程:低级控制和硬件交互Apr 06, 2025 am 12:06 AM

C 适合系统编程和硬件交互,因为它提供了接近硬件的控制能力和面向对象编程的强大特性。1)C 通过指针、内存管理和位操作等低级特性,实现高效的系统级操作。2)硬件交互通过设备驱动程序实现,C 可以编写这些驱动程序,处理与硬件设备的通信。

使用C的游戏开发:构建高性能游戏和模拟使用C的游戏开发:构建高性能游戏和模拟Apr 05, 2025 am 12:11 AM

C 适合构建高性能游戏和仿真系统,因为它提供接近硬件的控制和高效性能。1)内存管理:手动控制减少碎片,提高性能。2)编译时优化:内联函数和循环展开提升运行速度。3)低级操作:直接访问硬件,优化图形和物理计算。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境