为什么向浮点数组中添加 0.1f 与添加 0 相比,性能会降低 10 倍?
性能差异源于处理处理器的非正规(或次正规)浮点数。非正规数表示非常接近零的值,这会显着影响性能。
将 0.1f 添加到浮点数组时,结果可能是非正规数,即使原始值不是。这是因为浮点表示的精度有限。对非正规数的操作通常比对正规化数慢得多,因为许多处理器无法直接处理它们,必须使用微代码来解析它们。
相反,向浮点数组添加 0 不会产生非正规数。这是因为 0 已经是标准化数字。因此,涉及 0 的运算可以更高效地执行。
为了演示非正规数对性能的影响,请考虑以下代码:
const float x[16] = { 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6}; const float z[16] = {1.123, 1.234, 1.345, 156.467, 1.578, 1.689, 1.790, 1.812, 1.923, 2.034, 2.145, 2.256, 2.367, 2.478, 2.589, 2.690}; float y[16]; for (int i = 0; i < 16; i++) { y[i] = x[i]; } for (int j = 0; j < 9000000; j++) { for (int i = 0; i < 16; i++) { y[i] *= x[i]; y[i] /= z[i]; y[i] = y[i] + 0.1f; // <-- y[i] = y[i] - 0.1f; // <-- } }
这里,将 0.1f 添加到浮点数组导致速度显着减慢,因为结果值被转换为非正规数。
为了避免非正规数对性能的影响,您可以使用_MM_SET_FLUSH_ZERO_MODE(_MM_FLUSH_ZERO_ON); 将非正规数刷新为零的内在特征。这意味着任何非正规值都会四舍五入为零。通过使用此内在函数,您可以在使用浮点数组时显着提高代码的性能。
以上是为什么向浮点数组添加 0.1f 比添加 0 慢得多?如何解决此性能问题?的详细内容。更多信息请关注PHP中文网其他相关文章!