搜尋
首頁後端開發C++為什麼啟用編譯器最佳化後,我的浮點舍入程式碼會產生不同的結果?

Why Does My Floating-Point Rounding Code Produce Different Results with Compiler Optimizations Enabled?

啟用最佳化的浮點舍入差異:編譯器錯誤或最佳化困境?

浮點計算通常會表現出意外的行為,尤其是在啟用編譯器最佳化。考慮以下程式碼片段:

#include <cstdlib>
#include <iostream>
#include <cmath>

double round(double v, double digit)
{
    double pow = std::pow(10.0, digit);
    double t = v * pow;
    double r = std::floor(t + 0.5);
    return r / pow;
}

int main()
{
    std::cout <p>預期輸出:</p>
<pre class="brush:php;toolbar:false">4.5
4.6

但是,當使用具有最佳化(O1 - O3) 的g 編譯此程式碼時,輸出變為:

4.5
4.5

原因差異:

這種不一致源自於 x86 處理器內部使用 80 位元擴充精度進行浮點計算。然而,雙精度變數通常是 64 位元寬。當浮點值從 CPU 暫存器儲存到記憶體時,它們會從 80 位元精度舍入到 64 位元精度。此舍入可能會引入輕微錯誤。

最佳化程度的影響:

不同的最佳化等級可能會影響浮點值儲存到記憶體的頻率。優化等級越高,這種情況發生的頻率就越高。結果,舍入誤差變得更加明顯。

解決方案:

  1. 使用-ffloat-store GCC 選項: 這個選項指示編譯器將浮點變數儲存在記憶體中而不是寄存器中。這會強制在不同的最佳化層級上一致地進行舍入。
  2. 使用 long double 類型: long double 在 g 上通常為 80 位元寬。使用這種類型可以完全避免舍入問題。
  3. 修改變數儲存:將中間運算結果儲存到變數中,以最小化捨入誤差。

進一步的考慮因素:

  • Intel x86_64 版本是受此問題影響較小,因為編譯器預設使用SSE 暫存器來表示float和double,從而無需擴展精度。
  • -mfpmath 編譯器選項可用來控制 x86_64 建置中使用的浮點精確度。
  • 是否始終開啟 -ffloat-store 選項取決於特定應用及其對浮點精確度的敏感度。對於關鍵應用程序,使用此選項來確保結果一致可能是明智之舉。
  • 調查現有 C 程式碼和函式庫是否有潛在問題可能非常耗時。考慮使用工具或實施測試來檢測和解決任何浮點精確度問題。

以上是為什麼啟用編譯器最佳化後,我的浮點舍入程式碼會產生不同的結果?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
C#vs. C:編程語言的比較分析C#vs. C:編程語言的比較分析May 04, 2025 am 12:03 AM

C#和C 的主要區別在於語法、內存管理和性能:1)C#語法現代,支持lambda和LINQ,C 保留C特性並支持模板。 2)C#自動內存管理,C 需要手動管理。 3)C 性能優於C#,但C#性能也在優化中。

用C構建XML應用程序:實例用C構建XML應用程序:實例May 03, 2025 am 12:16 AM

在C 中處理XML數據可以使用TinyXML、Pugixml或libxml2庫。 1)解析XML文件:使用DOM或SAX方法,DOM適合小文件,SAX適合大文件。 2)生成XML文件:將數據結構轉換為XML格式並寫入文件。通過這些步驟,可以有效地管理和操作XML數據。

C中的XML:處理複雜的數據結構C中的XML:處理複雜的數據結構May 02, 2025 am 12:04 AM

在C 中處理XML數據結構可以使用TinyXML或pugixml庫。 1)使用pugixml庫解析和生成XML文件。 2)處理複雜的嵌套XML元素,如書籍信息。 3)優化XML處理代碼,建議使用高效庫和流式解析。通過這些步驟,可以高效處理XML數據。

C和性能:它仍然主導C和性能:它仍然主導May 01, 2025 am 12:14 AM

C 在性能優化方面仍然佔據主導地位,因為其低級內存管理和高效執行能力使其在遊戲開發、金融交易系統和嵌入式系統中不可或缺。具體表現為:1)在遊戲開發中,C 的低級內存管理和高效執行能力使得它成為遊戲引擎開發的首選語言;2)在金融交易系統中,C 的性能優勢確保了極低的延遲和高吞吐量;3)在嵌入式系統中,C 的低級內存管理和高效執行能力使得它在資源有限的環境中非常受歡迎。

C XML框架:為您選擇合適的一個C XML框架:為您選擇合適的一個Apr 30, 2025 am 12:01 AM

C XML框架的選擇應基於項目需求。 1)TinyXML適合資源受限環境,2)pugixml適用於高性能需求,3)Xerces-C 支持複雜的XMLSchema驗證,選擇時需考慮性能、易用性和許可證。

C#vs. C:為您的項目選擇正確的語言C#vs. C:為您的項目選擇正確的語言Apr 29, 2025 am 12:51 AM

C#适合需要开发效率和类型安全的项目,而C 适合需要高性能和硬件控制的项目。1)C#提供垃圾回收和LINQ,适用于企业应用和Windows开发。2)C 以高性能和底层控制著称,广泛用于游戏和系统编程。

c  怎麼進行代碼優化c 怎麼進行代碼優化Apr 28, 2025 pm 10:27 PM

C 代碼優化可以通過以下策略實現:1.手動管理內存以優化使用;2.編寫符合編譯器優化規則的代碼;3.選擇合適的算法和數據結構;4.使用內聯函數減少調用開銷;5.應用模板元編程在編譯時優化;6.避免不必要的拷貝,使用移動語義和引用參數;7.正確使用const幫助編譯器優化;8.選擇合適的數據結構,如std::vector。

如何理解C  中的volatile關鍵字?如何理解C 中的volatile關鍵字?Apr 28, 2025 pm 10:24 PM

C 中的volatile關鍵字用於告知編譯器變量值可能在代碼控制之外被改變,因此不能對其進行優化。 1)它常用於讀取可能被硬件或中斷服務程序修改的變量,如傳感器狀態。 2)volatile不能保證多線程安全,應使用互斥鎖或原子操作。 3)使用volatile可能導致性能slight下降,但確保程序正確性。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。