多執行緒程式碼中的記憶體屏障函數以及何時使用它們
簡介
簡介多執行緒中程式設計時,確保多個執行緒之間的資料一致性和連貫性至關重要。 Intel 提供了內部函數,例如 _mm_sfence()、_mm_lfence() 和 _mm_mfence(),來建立記憶體屏障並控制記憶體排序。了解何時使用這些函數對於有效和高效的程式碼最佳化至關重要。
_mm_sfence()/NT Stores_mm_sfence() 通常與非結合使用時間(NT)儲存。 NT 儲存是弱順序的,這意味著它們僅保證資料將刷新到內存,但不一定按特定順序。如果需要確保 NT 儲存對其他執行緒全域可見,則必須在 NT 儲存之後發出 _mm_sfence() 指令。
_mm_lfence()_mm_lfence() 指令充當負載柵欄,防止在前面的負載退出之前執行後續負載。然而,在 x86 CPU 上,通常不需要使用 _mm_lfence(),因為硬體可確保載入順序而沒有明確障礙。
_mm_mfence()_mm_mfence() 是最全面的記憶體屏障並建立順序一致性。它保證在執行任何後續記憶體操作之前,所有先前的載入和儲存都變得全域可見。 _mm_mfence() 主要在特定場景中有用,例如捲動您自己的 C11/C 11 std::atomic 實作或控制儲存到持久記憶體的資料順序。
C 11 std:: atomic在大多數情況下,建議使用 C 11 std::atomic 而不是手動實現記憶體屏障。 C 11 std::atomic 提供了高階函數,無需明確彙編程式碼即可確保記憶體排序和一致性。
NT 儲存與效能這很重要請注意,NT 儲存是針對特定用例而設計的,可能會影響效能。儲存操作通常不會影響可見的執行速度,因為它們會在 CPU 中緩衝。然而,在資料一致性和順序至關重要的情況下,NT 儲存與 _mm_sfence() 結合使用,可確保正確的程式行為。
NT 儲存和取得/釋放語意 使用 NT 儲存時,_mm_sfence() 提供釋放語義,確保其他執行緒中的後續操作只有在NT商店。類似地,如果消費者執行緒採用獲取語義方法(例如,memory_order_acquire),則 _mm_sfence() 確保在存取所取得的資料之前所有先前的 NT 儲存都變得全域可見。屏障和亂序執行
記憶體屏障,包括 _mm_sfence()、_mm_lfence() 和 _mm_mfence(),可能會影響現代的亂序執行CPU。這些 CPU 嘗試並行執行指令以提高效率。然而,當遇到記憶體障礙時,CPU 必須確保所有先前的記憶體操作都已完成,然後才能允許後續操作繼續進行,這可能會降低亂序執行帶來的效能增益。
以上是什麼時候應該在多線程程式碼中使用記憶體屏障函數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!