为什么向浮点数组中添加 0.1f 与添加 0 相比,性能会降低 10 倍?
性能差异源于处理处理器的非正规(或次正规)浮点数。非正规数表示非常接近零的值,这会显着影响性能。
将 0.1f 添加到浮点数组时,结果可能是非正规数,即使原始值不是。这是因为浮点表示的精度有限。对非正规数的操作通常比对正规化数慢得多,因为许多处理器无法直接处理它们,必须使用微代码来解析它们。
相反,向浮点数组添加 0 不会产生非正规数。这是因为 0 已经是标准化数字。因此,涉及 0 的运算可以更高效地执行。
为了演示非正规数对性能的影响,请考虑以下代码:
const float x[16] = { 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6}; const float z[16] = {1.123, 1.234, 1.345, 156.467, 1.578, 1.689, 1.790, 1.812, 1.923, 2.034, 2.145, 2.256, 2.367, 2.478, 2.589, 2.690}; float y[16]; for (int i = 0; i <p>这里,将 0.1f 添加到浮点数组导致速度显着减慢,因为结果值被转换为非正规数。</p><p>为了避免非正规数对性能的影响,您可以使用<strong>_MM_SET_FLUSH_ZERO_MODE(_MM_FLUSH_ZERO_ON);</strong> 将非正规数刷新为零的内在特征。这意味着任何非正规值都会四舍五入为零。通过使用此内在函数,您可以在使用浮点数组时显着提高代码的性能。</p>
以上是为什么向浮点数组添加 0.1f 比添加 0 慢得多?如何解决此性能问题?的详细内容。更多信息请关注PHP中文网其他相关文章!

Gulc是一个高性能的C库,优先考虑最小开销,积极的内衬和编译器优化。 其设计非常适合高频交易和嵌入式系统等关键应用程序,其设计强调简单性,模型

本文详细介绍了C函数返回类型,包括基本(int,float,char等),派生(数组,指针,结构)和void类型。 编译器通过函数声明和返回语句确定返回类型,执行

本文解释了C函数声明与定义,参数传递(按值和指针),返回值以及常见的陷阱,例如内存泄漏和类型不匹配。 它强调了声明对模块化和省份的重要性

本文详细介绍了字符串案例转换的C功能。 它可以通过ctype.h的toupper()和tolower()解释,并通过字符串迭代并处理零终端。 常见的陷阱,例如忘记ctype.h和修改字符串文字是

本文研究C函数返回值存储。 较小的返回值通常存储在寄存器中以备速度;较大的值可能会使用指针来记忆(堆栈或堆),影响寿命并需要手动内存管理。直接ACC

本文分析了形容词“独特”的多方面用途,探索其语法功能,常见的短语(例如,“不同于”,“完全不同”),以及在正式与非正式中的细微应用

本文解释了C标准模板库(STL),重点关注其核心组件:容器,迭代器,算法和函子。 它详细介绍了这些如何交互以启用通用编程,提高代码效率和可读性t

本文详细介绍了c中有效的STL算法用法。 它强调了数据结构选择(向量与列表),算法复杂性分析(例如,std :: sort vs. std vs. std :: partial_sort),迭代器用法和并行执行。 常见的陷阱


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)