搜尋
首頁後端開發C++C 中晦澀難懂的「restrict」關鍵字

The Obscure “restrict” Keyword in C

介紹

除此之外,C99 添加了limit 關鍵字,作為程式設計師指定指標是指向作用域中給定物件的唯一指標的一種方式,從而給編譯器一個“提示” ”,當透過該指標存取物件時,它可能會執行額外的最佳化。

問題

為了說明限制要解決的問題,請考慮以下函數:

void update_ptrs( int *p, int *q, int const *v ) {
  *p += *v;
  *q += *v;
}

編譯器將產生 x86-64 程式碼,例如:

mov eax, [rdx]  ; tmp = *v   // 1
add [rdi], eax  ; *p += tmp
mov eax, [rdx]  ; tmp = *v   // 3
add [rsi], eax  ; *q += tmp

你可能想知道為什麼它會產生第 3 行,因為它看起來與第 1 行是多餘的。問題是編譯器不知道你沒有做這樣的事情:

int x = 1, v = 2;
update_ptrs( &v, &x, &v );   // x = 5, v = 4

在update_ptrs() 中,p 和v 會別名 相同 int,因此編譯器必須謹慎行事並假設*v 的值可以在讀取之間發生變化,因此需要額外的mov 指令。

一般來說,C 中的指標會混淆最佳化,因為編譯器無法知道兩個指標是否彼此別名。 在效能關鍵的程式碼中,消除記憶體讀取可能是一個巨大的勝利如果編譯器可以安全地做到這一點。

解決方案

為了解決上述問題,C 中添加了 limit,允許您指定給定指針是 唯一 指向該指針作用域中的對象的指針,即同一作用域別名中沒有其他指針它。

要使用限制,請將其插入聲明中的 * 和指標名稱之間。 重寫為使用限制的 update_ptrs() 將是:

void update_ptrs_v2( int *restrict p, int *restrict q,
                     int const *restrict v ) {
  *p += *v;
  *q += *v;
}

(從右到左讀取,例如 v 是指向常數 int 的受限指標;或使用 cdecl。)

透過新增限制,編譯器現在可以產生以下程式碼:

mov eax, [rdx]  ; tmp = *v
add [rdi], eax  ; *p += tmp
add [rsi], eax  ; *q += tmp

現在,編譯器能夠刪除附加 mov 指令的前第 3 行。

也許最知名的使用restrict的例子是標準函式庫函數memcpy()。 這是複製記憶體區塊最快的方法如果來源位址和目標位址重疊。當位址 重疊時,可以使用稍慢的 memmove() 函數。

陷阱

濫用限制會導致未定義的行為,例如,將 do 彼此別名的指標傳遞給 update_ptrs_v2() 或 memcpy()。 在某些情況下,編譯器可以警告您,但並非在所有情況下,因此不要依賴編譯器來捕獲誤用。

請注意,restrict 是針對給定範圍的。 將一個受限制的指標分配給同一範圍內的另一個會導致未定義的行為:

void f( int *restrict d, int *restrict s ) {
  int *restrict p = s;    // undefined behavior

但是,您可以將受限的指標指派給不受限制的指標:

void f( int *restrict d, int *restrict s ) {
  int *p = s;             // OK

即使 p 不受限制,編譯器仍然可以執行相同的最佳化。

也可以將內部作用域中的受限指標指派給外部作用域中的另一個受限指標(但反之則不然):

void f( int *restrict d, int *restrict s ) {
  {                       // inner scope
    int *restrict p = s;  // OK
    // ...
    s = p;                // undefined behavior
  }
}

何時(以及何時不)使用限制

首先,您絕對應該分析您的程式碼(甚至可能查看生成的彙編程式碼),看看使用限制是否確實能夠帶來顯著的效能改進,以證明冒潛在陷阱的風險是合理的。 診斷因濫用限製而導致的錯誤非常很難做到。

其次,如果限制的使用僅限於實現透過受限指標存取的記憶體由you分配的函數,那麼它會更安全。 例如,給定:

void safer( unsigned n ) {
  n += n % 2 != 0;  // make even by rounding up
  int *const array = malloc( n * sizeof(unsigned) );
  unsigned *restrict half_1st = array;
  unsigned *restrict half_2nd = array + n/2;
  // ...
  free( array );
}

程式碼可以安全地對陣列的前半部和後半部進行操作,因為它們不重疊(假設您從未造訪 half_1st[n/2] 或更多)。

第三,如果在函數的參數中使用restrict,那麼它可能不太安全。 例如,將 Safer() 與 update_ptrs_v2() 進行對比,其中 呼叫者 控制指標。 據所知,呼叫者錯誤並傳遞了別名的指標。

各種各樣的

只有指向物件(或void)的指標可以用restrict限定:

restrict int x;       // error: can't restrict object
int restrict *p;      // error: pointer to restrict object
int (*restrict f)();  // error: pointer-to-function

可以對結構體成員使用restrict,例如:

struct node {
   void *restrict data;
   struct node *restrict left;
   struct node *restrict right;
};

表示 data 將是指向該資料的唯一指針,而 left 和 right 永遠不會指向同一個節點。 然而,對結構成員使用限制是非常不常見的。

最後,C++ 沒有有限制。 為什麼不呢? 答案很長,但 TL;DR 版本是:

  • 它可能是 C++ 委員會不想從 C 導入的難以發現的錯誤的來源。
  • C++ 越來越多地使用指針,例如這個,使得安全使用限制變得更加困難。

但是,許多編譯器都有 __restrict__ 作為擴充。

結論

在有限的情況下,使用限制可以提高效能,但也存在一些重大缺陷。 如果您正在考慮使用限制,請先分析您的程式碼。

明智地使用。

以上是C 中晦澀難懂的「restrict」關鍵字的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
c語言函數返回值的類型有哪些?返回值是由什麼決定的?c語言函數返回值的類型有哪些?返回值是由什麼決定的?Mar 03, 2025 pm 05:52 PM

本文詳細介紹了C函數返回類型,包括基本(int,float,char等),派生(數組,指針,結構)和void類型。 編譯器通過函數聲明和返回語句確定返回類型,執行

Gulc:從頭開始建造的C庫Gulc:從頭開始建造的C庫Mar 03, 2025 pm 05:46 PM

Gulc是一個高性能的C庫,優先考慮最小開銷,積極的內襯和編譯器優化。 其設計非常適合高頻交易和嵌入式系統等關鍵應用程序,其設計強調簡單性,模型

c語言函數的定義和調用規則是什麼c語言函數的定義和調用規則是什麼Mar 03, 2025 pm 05:53 PM

本文解釋了C函數聲明與定義,參數傳遞(按值和指針),返回值以及常見的陷阱,例如內存洩漏和類型不匹配。 它強調了聲明對模塊化和省份的重要性

c語言函數格式字母大小寫轉換步驟c語言函數格式字母大小寫轉換步驟Mar 03, 2025 pm 05:53 PM

本文詳細介紹了字符串案例轉換的C功能。 它可以通過ctype.h的toupper()和tolower()解釋,並通過字符串迭代並處理零終端。 常見的陷阱,例如忘記ctype.h和修改字符串文字是

c語言函數返回值在內存保存在哪裡?c語言函數返回值在內存保存在哪裡?Mar 03, 2025 pm 05:51 PM

本文研究C函數返回值存儲。 較小的返回值通常存儲在寄存器中以備速度;較大的值可能會使用指針來記憶(堆棧或堆),影響壽命並需要手動內存管理。直接ACC

distinct用法和短語分享distinct用法和短語分享Mar 03, 2025 pm 05:51 PM

本文分析了形容詞“獨特”的多方面用途,探索其語法功能,常見的短語(例如,“不同於”,“完全不同”),以及在正式與非正式中的細微應用

如何有效地使用STL(排序,查找,轉換等)的算法?如何有效地使用STL(排序,查找,轉換等)的算法?Mar 12, 2025 pm 04:52 PM

本文詳細介紹了c中有效的STL算法用法。 它強調了數據結構選擇(向量與列表),算法複雜性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和並行執行。 常見的陷阱

C標準模板庫(STL)如何工作?C標準模板庫(STL)如何工作?Mar 12, 2025 pm 04:50 PM

本文解釋了C標準模板庫(STL),重點關注其核心組件:容器,迭代器,算法和函子。 它詳細介紹了這些如何交互以啟用通用編程,提高代碼效率和可讀性t

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前By尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
4 週前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器