検索
ホームページバックエンド開発C++SSE2 を使用して Double と 64 ビット整数の間で効率的に変換するにはどうすればよいですか?

How Can We Efficiently Convert Between Doubles and 64-bit Integers Using SSE2?

AVX512 を使用しない効率的な Double/Int64 変換

SSE2 には、浮動小数点と 32 ビット整数の間の変換のための命令が用意されていますが、浮動小数点数と 32 ビット整数間の変換に相当する命令がありません。 double と 64 ビット整数。このような変換を効率的にシミュレートするにはどうすればよいでしょうか?

コーナー変換

範囲制限が許容される場合、次のトリックを使用すると、わずか 2 つの命令で変換を実行できます。

倍増Int64

__m128i double_to_int64(__m128d x) {
    x = _mm_add_pd(x, _mm_set1_pd(0x0018000000000000));
    return _mm_sub_epi64(_mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0018000000000000)));
}

Double から UInt64

__m128i double_to_uint64(__m128d x){
    x = _mm_add_pd(x, _mm_set1_pd(0x0010000000000000));
    return _mm_xor_si128(_mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)));
}

Int64 から Double

__m128d int64_to_double(__m128i x){
    x = _mm_add_epi64(x, _mm_castpd_si128(_mm_set1_pd(0x0018000000000000)));
    return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0018000000000000));
}

UInt64 からDouble

__m128d uint64_to_double(__m128i x){
    x = _mm_or_si128(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)));
    return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0010000000000000));
}

全範囲変換

64 ビット整数の全範囲を処理する変換について、最適化された実装を次に示します。

UInt64 からDouble

__m128d uint64_to_double_full(__m128i x){
    __m128i xH = _mm_srli_epi64(x, 32);
    xH = _mm_or_si128(xH, _mm_castpd_si128(_mm_set1_pd(19342813113834066795298816.)));          //  2^84
    __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0xcc);   //  2^52
    __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(19342813118337666422669312.));     //  2^84 + 2^52
    return _mm_add_pd(f, _mm_castsi128_pd(xL));
}

Int64 から Double

__m128d int64_to_double_full(__m128i x){
    __m128i xH = _mm_srai_epi32(x, 16);
    xH = _mm_blend_epi16(xH, _mm_setzero_si128(), 0x33);
    xH = _mm_add_epi64(xH, _mm_castpd_si128(_mm_set1_pd(442721857769029238784.)));              //  3*2^67
    __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0x88);   //  2^52
    __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(442726361368656609280.));          //  3*2^67 + 2^52
    return _mm_add_pd(f, _mm_castsi128_pd(xL));
}

以上がSSE2 を使用して Double と 64 ビット整数の間で効率的に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
神話を暴く:Cは本当に死んだ言語ですか?神話を暴く:Cは本当に死んだ言語ですか?May 05, 2025 am 12:11 AM

Cは死んでいませんが、多くの重要な領域で栄えています。1)ゲーム開発、2)システムプログラミング、3)高性能コンピューティング、4)ブラウザとネットワークアプリケーション、Cは依然として主流の選択であり、その強力な活力とアプリケーションのシナリオを示しています。

C#対C:プログラミング言語の比較分析C#対C:プログラミング言語の比較分析May 04, 2025 am 12:03 AM

C#とCの主な違いは、構文、メモリ管理、パフォーマンスです。1)C#構文は最新であり、LambdaとLinqをサポートし、CはC機能を保持し、テンプレートをサポートします。 2)C#はメモリを自動的に管理し、Cは手動で管理する必要があります。 3)CパフォーマンスはC#よりも優れていますが、C#パフォーマンスも最適化されています。

Cを使用したXMLアプリケーションの構築:実用的な例Cを使用したXMLアプリケーションの構築:実用的な例May 03, 2025 am 12:16 AM

tinyxml、pugixml、またはlibxml2ライブラリを使用して、CでXMLデータを処理できます。1)XMLファイルを解析する:DOMまたはSAXメソッドを使用し、DOMは小さなファイルに適しており、SAXは大きなファイルに適しています。 2)XMLファイルを生成:データ構造をXML形式に変換し、ファイルに書き込みます。これらの手順を通じて、XMLデータを効果的に管理および操作できます。

CのXML:複雑なデータ構造の処理CのXML:複雑なデータ構造の処理May 02, 2025 am 12:04 AM

CのXMLデータ構造を使用すると、TinyXMLまたはPUGIXMLライブラリを使用できます。 1)PUGIXMLライブラリを使用して、XMLファイルを解析して生成します。 2)本情報などの複雑なネストされたXML要素を処理します。 3)XML処理コードを最適化し、効率的なライブラリとストリーミング解析を使用することをお勧めします。これらの手順を通じて、XMLデータを効率的に処理できます。

Cとパフォーマンス:それがまだ支配している場所Cとパフォーマンス:それがまだ支配している場所May 01, 2025 am 12:14 AM

Cは、低レベルのメモリ管理と効率的な実行機能により、ゲーム開発、金融取引システム、組み込みシステムに不可欠であるため、パフォーマンスの最適化を支配しています。具体的には、次のように現れます。1)ゲーム開発では、Cの低レベルのメモリ管理と効率的な実行機能により、ゲームエンジン開発に適した言語になります。 2)金融取引システムでは、Cのパフォーマンスの利点は、非常に低いレイテンシと高スループットを保証します。 3)組み込みシステムでは、Cの低レベルのメモリ管理と効率的な実行機能により、リソースに制約のある環境で非常に人気があります。

c xmlフレームワーク:あなたにぴったりのフレームワークを選択しますc xmlフレームワーク:あなたにぴったりのフレームワークを選択しますApr 30, 2025 am 12:01 AM

C XMLフレームワークの選択は、プロジェクトの要件に基づいている必要があります。 1)TinyXMLは、リソースに制約のある環境に適しています。2)PUGIXMLは高性能要件に適しています。

C#対C:プロジェクトに適した言語を選択するC#対C:プロジェクトに適した言語を選択するApr 29, 2025 am 12:51 AM

C#は、開発効率とタイプの安全性を必要とするプロジェクトに適していますが、Cは高性能とハードウェア制御を必要とするプロジェクトに適しています。 1)C#は、エンタープライズアプリケーションやWindows開発に適したGarbage CollectionとLINQを提供します。 2)Cは、その高性能と根本的な制御で知られており、ゲームやシステムのプログラミングで広く使用されています。

コードを最適化する方法コードを最適化する方法Apr 28, 2025 pm 10:27 PM

Cコードの最適化は、次の戦略を通じて実現できます。1。最適化のためにメモリを手動で管理する。 2。コンパイラ最適化ルールに準拠したコードを書きます。 3.適切なアルゴリズムとデータ構造を選択します。 4.インライン関数を使用して、コールオーバーヘッドを削減します。 5.コンパイル時に最適化するために、テンプレートメタプログラムを適用します。 6.不要なコピーを避け、移動セマンティクスと参照パラメーターを使用します。 7. constを正しく使用して、コンパイラの最適化を支援します。 8。std :: vectorなどの適切なデータ構造を選択します。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!