搜尋
首頁後端開發C++x86_64 是否支援雙精度和 SSE/AVX 向量上的原子操作?

Does x86_64 Support Atomic Operations on Doubles and SSE/AVX Vectors?

x86_64 上的原子浮點運算和SSE/AVX 向量載入/儲存

雖然C 11 支援無鎖定std::atomic,但它確實確實支援由於CPU 依賴性,目前不支援原子AVX/SSE 向量。然而,問題出現了:x86_64 是否為雙精度或向量上的原子操作提供彙編級支援?

x86_64 上的原子操作

x86_64 支援以下對雙精度的原子操作,使用鎖執行-自由的說明:

  • 載入
  • 儲存

原子向量運算x86_64

不幸的是,無法保證128b 或 256b 向量在快取一致性系統中儲存或載入的原子性。但是,對於對齊向量,您可以安全地在共享雙精度數組上使用向量加載和存儲,而無需擔心撕裂的風險。

如果需要原子 16B 加載,則唯一的選擇是使用帶有desired=expected 的鎖 cmpxchg16b。如果成功,它將用自身取代現有值。如果失敗,您將獲得舊內容。請注意,此「載入」會在唯讀記憶體上出現錯誤,因此在將指標傳遞給執行此操作的函數時請小心。

原子 16B 儲存和 RMW 都可以以明顯的方式使用鎖定 cmpxchg16b。這使得純儲存比常規向量儲存昂貴得多,尤其是在多次重試 cmpxchg16b 的情況下。然而,原子 RMW 已經很昂貴了。

原子向量運算的限制

  • 原子<__m128d>由於使用 cmpxchg16b,即使對於只讀或只寫操作也會很慢。
  • atomic<__m256d>不能是無鎖的。
  • alignas(64)atomic共享緩衝區[1024];將允許自動向量化,但編譯器不會為此產生有效的 asm。

原子讀取和更新 16B 對象

您可以原子更新 16B 對象,但單獨讀取 8B 一半。然而,編譯器並沒有提供一種乾淨的方式來表達這一點,並且由於編譯器開發人員不斷的考慮,內聯 cmpxchg16b 是不可靠的。

以上是x86_64 是否支援雙精度和 SSE/AVX 向量上的原子操作?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
C#與C:歷史,進化和未來前景C#與C:歷史,進化和未來前景Apr 19, 2025 am 12:07 AM

C#和C 的歷史與演變各有特色,未來前景也不同。 1.C 由BjarneStroustrup在1983年發明,旨在將面向對象編程引入C語言,其演變歷程包括多次標準化,如C 11引入auto關鍵字和lambda表達式,C 20引入概念和協程,未來將專注於性能和系統級編程。 2.C#由微軟在2000年發布,結合C 和Java的優點,其演變注重簡潔性和生產力,如C#2.0引入泛型,C#5.0引入異步編程,未來將專注於開發者的生產力和雲計算。

C#vs. C:學習曲線和開發人員的經驗C#vs. C:學習曲線和開發人員的經驗Apr 18, 2025 am 12:13 AM

C#和C 的学习曲线和开发者体验有显著差异。1)C#的学习曲线较平缓,适合快速开发和企业级应用。2)C 的学习曲线较陡峭,适用于高性能和低级控制的场景。

C#vs. C:面向對象的編程和功能C#vs. C:面向對象的編程和功能Apr 17, 2025 am 12:02 AM

C#和C 在面向对象编程(OOP)中的实现方式和特性上有显著差异。1)C#的类定义和语法更为简洁,支持如LINQ等高级特性。2)C 提供更细粒度的控制,适用于系统编程和高性能需求。两者各有优势,选择应基于具体应用场景。

從XML到C:數據轉換和操縱從XML到C:數據轉換和操縱Apr 16, 2025 am 12:08 AM

從XML轉換到C 並進行數據操作可以通過以下步驟實現:1)使用tinyxml2庫解析XML文件,2)將數據映射到C 的數據結構中,3)使用C 標準庫如std::vector進行數據操作。通過這些步驟,可以高效地處理和操作從XML轉換過來的數據。

C#vs. C:內存管理和垃圾收集C#vs. C:內存管理和垃圾收集Apr 15, 2025 am 12:16 AM

C#使用自動垃圾回收機制,而C 採用手動內存管理。 1.C#的垃圾回收器自動管理內存,減少內存洩漏風險,但可能導致性能下降。 2.C 提供靈活的內存控制,適合需要精細管理的應用,但需謹慎處理以避免內存洩漏。

超越炒作:評估當今C的相關性超越炒作:評估當今C的相關性Apr 14, 2025 am 12:01 AM

C 在現代編程中仍然具有重要相關性。 1)高性能和硬件直接操作能力使其在遊戲開發、嵌入式系統和高性能計算等領域佔據首選地位。 2)豐富的編程範式和現代特性如智能指針和模板編程增強了其靈活性和效率,儘管學習曲線陡峭,但其強大功能使其在今天的編程生態中依然重要。

C社區:資源,支持和發展C社區:資源,支持和發展Apr 13, 2025 am 12:01 AM

C 學習者和開發者可以從StackOverflow、Reddit的r/cpp社區、Coursera和edX的課程、GitHub上的開源項目、專業諮詢服務以及CppCon等會議中獲得資源和支持。 1.StackOverflow提供技術問題的解答;2.Reddit的r/cpp社區分享最新資訊;3.Coursera和edX提供正式的C 課程;4.GitHub上的開源項目如LLVM和Boost提陞技能;5.專業諮詢服務如JetBrains和Perforce提供技術支持;6.CppCon等會議有助於職業

c#vs. c:每種語言都擅長c#vs. c:每種語言都擅長Apr 12, 2025 am 12:08 AM

C#適合需要高開發效率和跨平台支持的項目,而C 適用於需要高性能和底層控制的應用。 1)C#簡化開發,提供垃圾回收和豐富類庫,適合企業級應用。 2)C 允許直接內存操作,適用於遊戲開發和高性能計算。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。