搜索
首页后端开发C++为什么启用编译器优化后,我的浮点舍入代码会产生不同的结果?

Why Does My Floating-Point Rounding Code Produce Different Results with Compiler Optimizations Enabled?

启用优化的浮点舍入差异:编译器错误或优化困境?

浮点计算通常会表现出意外的行为,尤其是在启用编译器优化。考虑以下代码片段:

#include <cstdlib>
#include <iostream>
#include <cmath>

double round(double v, double digit)
{
    double pow = std::pow(10.0, digit);
    double t = v * pow;
    double r = std::floor(t + 0.5);
    return r / pow;
}

int main()
{
    std::cout <p>预期输出:</p>
<pre class="brush:php;toolbar:false">4.5
4.6

但是,当使用带有优化 (O1 - O3) 的 g 编译此代码时,输​​出变为:

4.5
4.5

差异原因:

这种不一致源于 x86 处理器内部使用 80 位扩展精度进行浮点计算。然而,双精度变量通常是 64 位宽。当浮点值从 CPU 寄存器存储到内存时,它们会从 80 位精度舍入到 64 位精度。此舍入可能会引入轻微错误。

优化级别的影响:

不同的优化级别可能会影响浮点值保存到内存中的频率。优化级别越高,这种情况发生的频率就越高。结果,舍入误差变得更加明显。

解决方案:

  1. 使用 -ffloat-store GCC 选项: 这个选项指示编译器将浮点变量存储在内存中而不是寄存器中。这会强制在不同的优化级别上一致地进行舍入。
  2. 使用 long double 类型: long double 在 g 上通常为 80 位宽。使用这种类型可以完全避免舍入问题。
  3. 修改变量存储:将中间计算结果存储到变量中,以最小化舍入误差。

进一步的注意事项:

  • Intel x86_64 版本受此问题的影响较小,因为编译器默认使用 SSE 寄存器来表示 float 和 double,从而无需扩展精度。
  • - mfpmath 编译器选项可用于控制 x86_64 构建中使用的浮点精度。
  • 是否始终打开 -ffloat-store 选项取决于特定应用程序及其对浮点精度的敏感度。对于关键应用程序,使用此选项来确保结果一致可能是明智之举。
  • 调查现有 C 代码和库是否存在潜在问题可能非常耗时。考虑使用工具或实施测试来检测和解决任何浮点精度问题。

以上是为什么启用编译器优化后,我的浮点舍入代码会产生不同的结果?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
用C构建XML应用程序:实例用C构建XML应用程序:实例May 03, 2025 am 12:16 AM

在C 中处理XML数据可以使用TinyXML、Pugixml或libxml2库。1)解析XML文件:使用DOM或SAX方法,DOM适合小文件,SAX适合大文件。2)生成XML文件:将数据结构转换为XML格式并写入文件。通过这些步骤,可以有效地管理和操作XML数据。

C中的XML:处理复杂的数据结构C中的XML:处理复杂的数据结构May 02, 2025 am 12:04 AM

在C 中处理XML数据结构可以使用TinyXML或pugixml库。1)使用pugixml库解析和生成XML文件。2)处理复杂的嵌套XML元素,如书籍信息。3)优化XML处理代码,建议使用高效库和流式解析。通过这些步骤,可以高效处理XML数据。

C和性能:它仍然主导C和性能:它仍然主导May 01, 2025 am 12:14 AM

C 在性能优化方面仍然占据主导地位,因为其低级内存管理和高效执行能力使其在游戏开发、金融交易系统和嵌入式系统中不可或缺。具体表现为:1)在游戏开发中,C 的低级内存管理和高效执行能力使得它成为游戏引擎开发的首选语言;2)在金融交易系统中,C 的性能优势确保了极低的延迟和高吞吐量;3)在嵌入式系统中,C 的低级内存管理和高效执行能力使得它在资源有限的环境中非常受欢迎。

C XML框架:为您选择合适的一个C XML框架:为您选择合适的一个Apr 30, 2025 am 12:01 AM

C XML框架的选择应基于项目需求。1)TinyXML适合资源受限环境,2)pugixml适用于高性能需求,3)Xerces-C 支持复杂的XMLSchema验证,选择时需考虑性能、易用性和许可证。

C#vs. C:为您的项目选择正确的语言C#vs. C:为您的项目选择正确的语言Apr 29, 2025 am 12:51 AM

C#适合需要开发效率和类型安全的项目,而C 适合需要高性能和硬件控制的项目。 1)C#提供垃圾回收和LINQ,适用于企业应用和Windows开发。 2)C 以高性能和底层控制着称,广泛用于游戏和系统编程。

c  怎么进行代码优化c 怎么进行代码优化Apr 28, 2025 pm 10:27 PM

C 代码优化可以通过以下策略实现:1.手动管理内存以优化使用;2.编写符合编译器优化规则的代码;3.选择合适的算法和数据结构;4.使用内联函数减少调用开销;5.应用模板元编程在编译时优化;6.避免不必要的拷贝,使用移动语义和引用参数;7.正确使用const帮助编译器优化;8.选择合适的数据结构,如std::vector。

如何理解C  中的volatile关键字?如何理解C 中的volatile关键字?Apr 28, 2025 pm 10:24 PM

C 中的volatile关键字用于告知编译器变量值可能在代码控制之外被改变,因此不能对其进行优化。1)它常用于读取可能被硬件或中断服务程序修改的变量,如传感器状态。2)volatile不能保证多线程安全,应使用互斥锁或原子操作。3)使用volatile可能导致性能slight下降,但确保程序正确性。

怎样在C  中测量线程性能?怎样在C 中测量线程性能?Apr 28, 2025 pm 10:21 PM

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析,步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析,步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能,并优化代码。

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具