float 配列に 0.1f を追加すると、0 を追加する場合に比べてパフォーマンスが 10 倍遅くなるのはなぜですか?
パフォーマンスの違いは処理によって生じます。プロセッサによる非正規化 (または非正規化) 浮動小数点数の計算。非正規数はゼロに非常に近い値を表し、パフォーマンスに大きな影響を与える可能性があります。
float 配列に 0.1f を追加すると、元の値が非正規数でなくても、結果が非正規数になることがあります。これは、浮動小数点表現の精度が限られているためです。非正規数に対する演算は、通常、正規化された数値に対する演算よりもはるかに遅くなります。これは、多くのプロセッサが非正規数を直接処理できず、マイクロコードを使用して非正規数を解決する必要があるためです。
対照的に、float 配列に 0 を加算しても、非正規数は生成されません。これは、0 がすでに正規化された数値であるためです。したがって、0 を含む演算はより効率的に実行できます。
非正規数のパフォーマンスへの影響を示すために、次のコードを検討してください。
const float x[16] = { 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6}; const float z[16] = {1.123, 1.234, 1.345, 156.467, 1.578, 1.689, 1.790, 1.812, 1.923, 2.034, 2.145, 2.256, 2.367, 2.478, 2.589, 2.690}; float y[16]; for (int i = 0; i <p>ここでは、float 配列に 0.1f を追加しています。結果の値は非正規数に変換されるため、速度が大幅に低下します。</p><p>非正規数によるパフォーマンスへの影響を回避するには、 <strong>_MM_SET_FLUSH_ZERO_MODE(_MM_FLUSH_ZERO_ON);</strong> は非正規化をゼロにフラッシュするための組み込み関数です。これは、非正規化されるはずの値がゼロに丸められることを意味します。この組み込みを使用すると、浮動小数点配列を操作する際のコードのパフォーマンスを大幅に向上させることができます。</p>
以上がfloat 配列に 0.1f を追加すると、0 を追加するよりも大幅に遅いのはなぜですか? このパフォーマンスの問題はどのように解決できるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

GULCは、最小限のオーバーヘッド、積極的なインライン、およびコンパイラの最適化を優先する高性能Cライブラリです。 高周波取引や組み込みシステムなどのパフォーマンスクリティカルなアプリケーションに最適な設計では、シンプルさ、モジュールが強調されています

この記事では、c関数のリターンタイプ、基本(int、float、charなど)、派生(配列、ポインター、構造体)、およびvoid型を含む詳細を示します。 コンパイラは、関数宣言とreturnステートメントを介して返品タイプを決定し、強制します

この記事では、C関数宣言と定義、引数の合格(価値とポインターによる)、返品値、およびメモリリークやタイプの不一致などの一般的な落とし穴について説明します。 モジュール性とProviの宣言の重要性を強調しています

この記事では、文字列ケース変換のC関数について詳しく説明しています。 ctype.hのtoupper()とtolower()を使用し、文字列を介して繰り返し、ヌルターミネーターを処理することを説明しています。 ctype.hを忘れたり、文字列リテラルを変更するなどの一般的な落とし穴は

この記事では、C関数の戻り値ストレージを調べます。 通常、リターン値は通常、速度のためにレジスタに保存されます。値が大きいと、ポインターをメモリ(スタックまたはヒープ)に使用し、寿命に影響を与え、手動のメモリ管理が必要になります。直接acc

この記事では、C標準テンプレートライブラリ(STL)について説明し、そのコアコンポーネント(コンテナ、イテレーター、アルゴリズム、およびファンクター)に焦点を当てています。 これらが一般的なプログラミングを有効にし、コード効率を向上させ、読みやすさを改善する方法を詳述しています。

この記事では、形容詞の「個別」の多面的な使用法を分析し、その文法機能、一般的なフレーズ(例:「はっきりと異なる」とは異なる」、およびフォーマルと非公式の微妙なアプリケーションを調査します。

この記事では、cの効率的なSTLアルゴリズムの使用について詳しく説明しています。 データ構造の選択(ベクトル対リスト)、アルゴリズムの複雑さ分析(STD :: STD :: STD :: PARTIAL_SORTなど)、イテレーターの使用、および並列実行を強調しています。 のような一般的な落とし穴


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









