搜尋
首頁後端開發C++我們如何取消優化英特爾 Sandybridge 處理器的蒙特卡羅模擬?

How Can We Deoptimize a Monte-Carlo Simulation for Intel Sandybridge Processors?

對Intel Sandybridge 系列CPU 中的管道進行去最佳化

簡介

簡介

簡介

  • 簡介
  • 簡介

是任務透過利用Intel Sandybridge 處理器來降低Monte-Carlo 模擬程式的效率建築學。此處理器具有無序管道,具有暫存器重命名和儲存緩衝等功能,因此降低指令級並行性 (ILP) 並引入危險具有挑戰性。

程式分析

    程式是蒙特卡羅模擬,用於計算歐洲普通買權和賣權的價格。此程式的關鍵組件是:
  • 迭代指定次數的循環
  • 高斯隨機數產生Black-Scholes 選擇權定價公式
  • 最佳化技術
  • 以下技術可用於降低程式效率:
  • 錯誤依賴關係:在指令之間引入不必要的依賴關係,以增加危險停頓。
  • 記憶體瓶頸:導致快取未命中和記憶體存取因資料不對齊或使用非連續記憶體存取模式而導致延遲。
  • 延遲指令:使用具有較長延遲且可能被管道延遲的指令。

效率較低的運算:使用效率較低的數學運算,例如除法,而不是乘法。

分支錯誤預測:

引入不可預測的分支導致管道刷新。 儲存轉送停頓:使用雙精確度高位元組異或等技術引起儲存轉送指令快取未命中:將程式分成小塊以導致指令快取未命中。 具體建議 基於上述技術,這裡有一些悲觀化的具體建議節目:
  • 使用 std::atomic; for 迴圈計數器並使其不對齊。
  • 在非原子變數之間引入錯誤共享。
  • 具有單一共用 std::atomic 循環計數器的多執行緒。
  • 以關聯/分配等價重寫表達式以增加工作。
  • 小心使用內部函數以避免管道停頓。
  • 使用內聯彙編來分解 uop 快取。
  • 使用 CPUID/RDTSC 來計時每次迭代並引發序列化.
  • 以非連續順序遍歷數組並使用帶填充和未對齊的數組元素。
  • 使用 雙精確度 精確度取代 float 來增加延遲。
  • 強制從整數轉換為浮點數,然後再回傳。
  • 使用 -O0 停用編譯器最佳化並使用-march=i386 用於較慢的指令。
  • 經常設定不同 CPU 的 CPU 關聯性。

以上是我們如何取消優化英特爾 Sandybridge 處理器的蒙特卡羅模擬?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
C標準模板庫(STL)如何工作?C標準模板庫(STL)如何工作?Mar 12, 2025 pm 04:50 PM

本文解釋了C標準模板庫(STL),重點關注其核心組件:容器,迭代器,算法和函子。 它詳細介紹了這些如何交互以啟用通用編程,提高代碼效率和可讀性t

如何有效地使用STL(排序,查找,轉換等)的算法?如何有效地使用STL(排序,查找,轉換等)的算法?Mar 12, 2025 pm 04:52 PM

本文詳細介紹了c中有效的STL算法用法。 它強調了數據結構選擇(向量與列表),算法複雜性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和並行執行。 常見的陷阱

我如何在C中有效處理異常?我如何在C中有效處理異常?Mar 12, 2025 pm 04:56 PM

本文詳細介紹了C中的有效異常處理,涵蓋了嘗試,捕捉和投擲機制。 它強調了諸如RAII之類的最佳實踐,避免了不必要的捕獲塊,並為強大的代碼登錄例外。 該文章還解決了Perf

在C中如何有效地使用RVALUE參考?在C中如何有效地使用RVALUE參考?Mar 18, 2025 pm 03:29 PM

文章討論了在C中有效使用RVALUE參考,以進行移動語義,完美的轉發和資源管理,重點介紹最佳實踐和性能改進。(159個字符)

如何在C 20中使用範圍進行更有表現的數據操縱?如何在C 20中使用範圍進行更有表現的數據操縱?Mar 17, 2025 pm 12:58 PM

C 20範圍通過表現力,合成性和效率增強數據操作。它們簡化了複雜的轉換並集成到現有代碼庫中,以提高性能和可維護性。

如何使用C中的移動語義來提高性能?如何使用C中的移動語義來提高性能?Mar 18, 2025 pm 03:27 PM

本文討論了使用C中的移動語義來通過避免不必要的複制來提高性能。它涵蓋了使用std :: Move的實施移動構造函數和任務運算符,並確定了關鍵方案和陷阱以有效

動態調度如何在C中起作用,如何影響性能?動態調度如何在C中起作用,如何影響性能?Mar 17, 2025 pm 01:08 PM

本文討論了C中的動態調度,其性能成本和優化策略。它突出了動態調度會影響性能並將其與靜態調度進行比較的場景,強調性能和之間的權衡

C語言數據結構:樹和圖的數據表示與操作C語言數據結構:樹和圖的數據表示與操作Apr 04, 2025 am 11:18 AM

C語言數據結構:樹和圖的數據表示與操作樹是一個層次結構的數據結構由節點組成,每個節點包含一個數據元素和指向其子節點的指針二叉樹是一種特殊類型的樹,其中每個節點最多有兩個子節點數據表示structTreeNode{intdata;structTreeNode*left;structTreeNode*right;};操作創建樹遍歷樹(先序、中序、後序)搜索樹插入節點刪除節點圖是一個集合的數據結構,其中的元素是頂點,它們通過邊連接在一起邊可以是帶權或無權的數據表示鄰

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),