搜尋
首頁後端開發C++如何進一步優化蒙特卡羅模擬以顯著減慢英特爾 Sandybridge 系列 CPU 的執行速度?

How Can a Monte Carlo Simulation Be Further Deoptimized to Significantly Slow Down Execution on an Intel Sandybridge-Family CPU?

對 Intel Sandybridge 系列 CPU 中的管道進行去優化

目標: 透過利用以下知識來悲觀程式運行速度較慢英特爾 i7

問題:

作業提供了兩個選項:油石或蒙特卡羅程式。學生選擇了蒙地卡羅模擬程序,但他們的悲觀努力只增加了代碼運行時間一秒。

問題:

學生如何進一步悲觀化程式碼實現更有意義速度變慢?

答案:

一般策略:

  • 引入不可預測的分支來增加誤預測懲罰。
  • 延長循環攜帶的依賴鏈以減少指令等級並行性。
  • 使用較慢的 FP 運算和 div,尤其是 exp 和 log 函數。

Uarch 特定想法:

具有內在函數():

  • 使用movnti 從快取中逐出資料。
  • 在 FP 數學運算之間使用整數洗牌以導致旁路延遲。
  • 避免混合 SSE 和 AVX 指令而不使用vzeroupper。

使用(內聯)asm:

  • 強制對齊問題以破壞 uop 快取。
  • 使用self-修改程式碼觸發管道

導致快取未命中和記憶體減慢:

  • 執行狹窄存儲導致儲存轉發停頓。
  • 取代具有大結構成員的局部變數來控制記憶體佈局。
  • 安排記憶體佈局以增加快取未命中和頁面拆分載入。
  • 使用未對齊的變數來跨越快取行或頁面邊界。
  • 以非循環方式循環數組-連續順序。
  • 考慮使用鍊錶而不是

其他技術:

  • 使用std::atomic;於較慢的原子操作。
  • 使用 -m32 或 -march=i386 編譯以強制減慢程式碼產生速度。
  • 強制使用較低精度的長雙精度計算以獲得額外的速度。
  • 經常將CPU親和力設定為不同的CPU。
  • 為上下文切換實現過多的系統呼叫

最後的註解:

  • 雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>雖然這些技術有效地減慢>了代碼的速度,但它們的「惡魔般的無能」程度取決於給出的理由.
  • 作業講師可能想讓學生了解管道危險和依賴性,而不僅僅是應用這些技術盲目地。

以上是如何進一步優化蒙特卡羅模擬以顯著減慢英特爾 Sandybridge 系列 CPU 的執行速度?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
C#和C:探索不同的範例C#和C:探索不同的範例May 08, 2025 am 12:06 AM

C#和C 的主要區別在於內存管理、多態性實現和性能優化。 1)C#使用垃圾回收器自動管理內存,C 則需要手動管理。 2)C#通過接口和虛方法實現多態性,C 使用虛函數和純虛函數。 3)C#的性能優化依賴於結構體和並行編程,C 則通過內聯函數和多線程實現。

C XML解析:技術和最佳實踐C XML解析:技術和最佳實踐May 07, 2025 am 12:06 AM

C 中解析XML數據可以使用DOM和SAX方法。 1)DOM解析將XML加載到內存,適合小文件,但可能佔用大量內存。 2)SAX解析基於事件驅動,適用於大文件,但無法隨機訪問。選擇合適的方法並優化代碼可提高效率。

c在特定領域:探索其據點c在特定領域:探索其據點May 06, 2025 am 12:08 AM

C 在遊戲開發、嵌入式系統、金融交易和科學計算等領域中的應用廣泛,原因在於其高性能和靈活性。 1)在遊戲開發中,C 用於高效圖形渲染和實時計算。 2)嵌入式系統中,C 的內存管理和硬件控制能力使其成為首選。 3)金融交易領域,C 的高性能滿足實時計算需求。 4)科學計算中,C 的高效算法實現和數據處理能力得到充分體現。

揭穿神話:C真的是一種死語嗎?揭穿神話:C真的是一種死語嗎?May 05, 2025 am 12:11 AM

C 沒有死,反而在許多關鍵領域蓬勃發展:1)遊戲開發,2)系統編程,3)高性能計算,4)瀏覽器和網絡應用,C 依然是主流選擇,展現了其強大的生命力和應用場景。

C#vs. C:編程語言的比較分析C#vs. C:編程語言的比較分析May 04, 2025 am 12:03 AM

C#和C 的主要區別在於語法、內存管理和性能:1)C#語法現代,支持lambda和LINQ,C 保留C特性並支持模板。 2)C#自動內存管理,C 需要手動管理。 3)C 性能優於C#,但C#性能也在優化中。

用C構建XML應用程序:實例用C構建XML應用程序:實例May 03, 2025 am 12:16 AM

在C 中處理XML數據可以使用TinyXML、Pugixml或libxml2庫。 1)解析XML文件:使用DOM或SAX方法,DOM適合小文件,SAX適合大文件。 2)生成XML文件:將數據結構轉換為XML格式並寫入文件。通過這些步驟,可以有效地管理和操作XML數據。

C中的XML:處理複雜的數據結構C中的XML:處理複雜的數據結構May 02, 2025 am 12:04 AM

在C 中處理XML數據結構可以使用TinyXML或pugixml庫。 1)使用pugixml庫解析和生成XML文件。 2)處理複雜的嵌套XML元素,如書籍信息。 3)優化XML處理代碼,建議使用高效庫和流式解析。通過這些步驟,可以高效處理XML數據。

C和性能:它仍然主導C和性能:它仍然主導May 01, 2025 am 12:14 AM

C 在性能優化方面仍然佔據主導地位,因為其低級內存管理和高效執行能力使其在遊戲開發、金融交易系統和嵌入式系統中不可或缺。具體表現為:1)在遊戲開發中,C 的低級內存管理和高效執行能力使得它成為遊戲引擎開發的首選語言;2)在金融交易系統中,C 的性能優勢確保了極低的延遲和高吞吐量;3)在嵌入式系統中,C 的低級內存管理和高效執行能力使得它在資源有限的環境中非常受歡迎。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器