為什麼轉置512x512 矩陣比轉置513x513 慢
在對不同大小的矩陣進行實驗後,出現了轉置矩陣的一個奇特現象:轉置矩陣維度為2^ 的矩陣n 在計算上比轉置維度為2^n 1 的計算成本更高。當 n 等於 512 時,差異變得顯著。
為轉置運算提供的程式碼如下:
#define SAMPLES 1000 #define MATSIZE 512 #include <time.h> #include <iostream> int mat[MATSIZE][MATSIZE]; void transpose() { for ( int i = 0 ; i <p>透過更改 MATSIZE 宏,可以修改矩陣的大小。以下基準說明了明顯的差異:</p> <ul> <li>大小512:平均2.46 毫秒</li> <li>大小513:平均0.75 毫秒</li> </ul> <h2 id="快取爭用和關鍵步幅">快取爭用和關鍵步幅</h2> <p>此異常背後的原因在於快取行為以及快取爭用的概念。以下是細分:</p> <ul> <li>快取由集合和行組成。在任何給定時刻,僅訪問一組,並且可以使用該組內的任何線路。總快取大小由行數乘以每行大小決定。 </li> <li>要計算特定記憶體位址所屬的集合,請使用下列公式:set = ( address / lineSize ) % numberOfsets.</li> <li>當多個記憶體位址存取同一個集合時,就會出現緩存衝突。在這種情況下,集合中最近最少使用的行將被新檢索的資料覆蓋。 </li> <li>關鍵步長,表示導致快取衝突的記憶體存取次數,計算公式為: criticalStride = numberOfSets * lineSize。 </li> <li>對於具有 8kb 快取的 64x64 矩陣,關鍵步幅將與矩陣的行完美對齊,從而導致轉置期間過多的快取重新載入。 </li> <li>但是,當矩陣大小增加到 65x65 時,關鍵步幅不再完美對齊,從而減少快取衝突的頻率並提高效能。 </li> </ul> <p>因此,由於快取爭用,對於維度為 2^n 倍數的矩陣,轉置操作會明顯變慢。 </p></iostream></time.h>
以上是為什麼轉置 512x512 矩陣比轉置 513x513 矩陣慢很多?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文解釋了C標準模板庫(STL),重點關注其核心組件:容器,迭代器,算法和函子。 它詳細介紹了這些如何交互以啟用通用編程,提高代碼效率和可讀性t

本文詳細介紹了c中有效的STL算法用法。 它強調了數據結構選擇(向量與列表),算法複雜性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和並行執行。 常見的陷阱

本文討論了C中的動態調度,其性能成本和優化策略。它突出了動態調度會影響性能並將其與靜態調度進行比較的場景,強調性能和之間的權衡

C 20範圍通過表現力,合成性和效率增強數據操作。它們簡化了複雜的轉換並集成到現有代碼庫中,以提高性能和可維護性。

本文詳細介紹了C中的有效異常處理,涵蓋了嘗試,捕捉和投擲機制。 它強調了諸如RAII之類的最佳實踐,避免了不必要的捕獲塊,並為強大的代碼登錄例外。 該文章還解決了Perf

本文討論了使用C中的移動語義來通過避免不必要的複制來提高性能。它涵蓋了使用std :: Move的實施移動構造函數和任務運算符,並確定了關鍵方案和陷阱以有效

文章討論了在C中有效使用RVALUE參考,以進行移動語義,完美的轉發和資源管理,重點介紹最佳實踐和性能改進。(159個字符)


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SublimeText3 Linux新版
SublimeText3 Linux最新版

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。