編譯器最佳化與未定義行為:C 是否允許對布林值進行某些假設?
簡介
本文探討了 C 標準是否允許編譯器為 bool 假設某些數值表示以及這樣的假設是否會導致程式崩潰等後果。
問題
程式設計師在序列化函數中使用未初始化的 bool 值時遇到程式崩潰將布林值轉換為字串。令人驚訝的是,崩潰僅發生在使用啟用了最佳化的特定編譯器的特定平台上。
有問題的程式碼:
void Serialize(bool boolValue) { const char* whichString = boolValue ? "true" : "false"; const size_t len = strlen(whichString); memcpy(destBuffer, whichString, len); }
當使用 Clang 5.0.0 和最佳化執行程式碼時( -O2),它可能會崩潰。出現此行為的原因是優化器推斷字串「true」和「false」的長度僅相差 1。它不計算實際長度,而是使用 boolValue 的值(假設該值是 0 或 1)。
const size_t len = strlen(whichString); // original code const size_t len = 5 - boolValue; // clang optimization
問題:標準注意事項
文章提出了問題:C 標準是否允許編譯器假設bool 只能有「0」或「1」的內部數字表示並以這種方式使用它?或者這是實現定義的行為的情況,其中實現假定其所有布林值僅包含 0 或 1,並且任何其他值都是未定義的行為範圍?
答案:標準一致性
根據作者的說法,ISO C 允許(但不要求)實現來實現這一點選擇。 ISO C 未指定 bool 的內部表示是什麼,允許實現做出自己的假設。
編譯器最佳化行為
System V ABI: 對於使用System V ABI 的平台(通常在x86-64 系統上使用),布林值傳遞給函數的參數由位元模式表示:暫存器的低8 位元中0 = false 和1 = true。在記憶體中,bool 是 1 位元組類型,必須具有整數值 0 或 1。
此 ABI 決策允許編譯器利用最佳化,例如假設 bool 為 0 或 1 並按位元執行操作而不是昂貴的類型轉換。在提供的範例中,優化器利用此行為將 strlen(whichString) 最佳化為 5U - boolValue。
其他實作與假設:
雖然 System V ABI 被廣泛使用,但其他實作可能會做出不同的假設。例如,他們可以認為 0 = false,任何非零值 = true。在這種情況下,編譯器可能不會產生因未初始化的 bool 值而崩潰的程式碼,但它仍然可以被視為未定義的行為。
程式崩潰的危險
雖然C 標準允許此類最佳化,但值得注意的是,遇到未定義行為的程式在其整個存在過程中都被視為完全未定義。這意味著即使在從未實際呼叫的函數中遇到未定義的行為,也可能會發生崩潰。
最佳實踐和避免未定義的行為
編譯器正在成為越來越積極地優化程式碼,根據他們對實現的內部理解來假設行為。對於程式設計師來說,避免依賴實現假設並確保他們的程式碼是有效的 C 語言而不假設它的行為像可移植彙編語言至關重要。
為了避免問題,程式設計師應該遵循以下最佳實務:
以上是C 編譯器是否可以假設布林值的數值表示形式僅為 0 或 1,這是否會導致未定義的行為?的詳細內容。更多資訊請關注PHP中文網其他相關文章!