Rumah >pembangunan bahagian belakang >C++ >Bagaimanakah Saya Boleh Menukar Antara Terapung Ketepatan Berganda dan Integer 64-bit Dengan Cekap Menggunakan Arahan SSE/AVX?

Bagaimanakah Saya Boleh Menukar Antara Terapung Ketepatan Berganda dan Integer 64-bit Dengan Cekap Menggunakan Arahan SSE/AVX?

Barbara Streisandasal: 2024-12-08 03:02:15555semak imbas

How Can I Efficiently Convert Between Double-Precision Floats and 64-bit Integers Using SSE/AVX Instructions?

Penukaran Berganda/int64 Cekap dengan SSE/AVX

SSE2 menyediakan intrinsik untuk menukar vektor antara apungan ketepatan tunggal dan integer 32-bit, tetapi tidak mempunyai rakan sejawatan langsung untuk titik terapung berketepatan dua dan integer 64-bit. AVX juga tidak menawarkan penukaran ini.

Kaedah untuk mensimulasikan intrinsik

1. Untuk nilai terhad:

Jika pengehadan tertentu diterima, penukaran antara beregu dan int64 boleh dilakukan dengan hanya dua pernyataan:

berganda -> ; uint64_t:

__m128i double_to_uint64(__m128d x){
  x = _mm_add_pd(x, _mm_set1_pd(0x0010000000000000));
  return _mm_xor_si128(
      _mm_castpd_si128(x),
      _mm_castpd_si128(_mm_set1_pd(0x0010000000000000))
  );
}

ganda -> int64_t:

__m128i double_to_int64(__m128d x){
  x = _mm_add_pd(x, _mm_set1_pd(0x0018000000000000));
  return _mm_sub_epi64(
      _mm_castpd_si128(x),
      _mm_castpd_si128(_mm_set1_pd(0x0018000000000000))
  );
}

uint64_t -> berganda:

__m128d uint64_to_double(__m128i x){
  x = _mm_or_si128(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)));
  return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0010000000000000));
}

int64_t -> berganda:

__m128d int64_to_double(__m128i x){
  x = _mm_add_epi64(x, _mm_castpd_si128(_mm_set1_pd(0x0018000000000000)));
  return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0018000000000000));
}

2. Julat penuh int64 -> double:

Untuk menukar julat penuh int64 kepada double, 5 arahan diperlukan untuk uint64_t dan 6 arahan untuk int64_t:

uint64_t -> ; berganda:

__m128d uint64_to_double_full(__m128i x){
  __m128i xH = _mm_srli_epi64(x, 32);
  xH = _mm_or_si128(xH, _mm_castpd_si128(_mm_set1_pd(19342813113834066795298816.)));          //  2^84
  __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0xcc);   //  2^52
  __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(19342813118337666422669312.));     //  2^84 + 2^52
  return _mm_add_pd(f, _mm_castsi128_pd(xL));
}

int64_t -> berganda:

__m128d int64_to_double_full(__m128i x){
  __m128i xH = _mm_srai_epi32(x, 16);
  xH = _mm_blend_epi16(xH, _mm_setzero_si128(), 0x33);
  xH = _mm_add_epi64(xH, _mm_castpd_si128(_mm_set1_pd(442721857769029238784.)));              //  3*2^67
  __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0x88);   //  2^52
  __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(442726361368656609280.));          //  3*2^67 + 2^52
  return _mm_add_pd(f, _mm_castsi128_pd(xL));
}

AVX512

AVX512 menawarkan penukaran terus kepada/daripada integer 64-bit, kedua-duanya ditandatangani dan tidak ditandatangani ditandatangani. Penukaran ini dilakukan menggunakan intrinsik seperti _mm512_cvtpd_epi64 dan _mm256_cvtpd_epi64.

Sila ambil perhatian bahawa penyelesaian ini tidak disediakan sebagai kod lengkap. Pembaca dijangka melengkapkannya dan mengoptimumkannya mengikut keperluan untuk menyesuaikannya dengan konteks khusus mereka.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menukar Antara Terapung Ketepatan Berganda dan Integer 64-bit Dengan Cekap Menggunakan Arahan SSE/AVX?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

for double using

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Bagaimanakah Saya Boleh Melaksanakan Mesin Negeri dengan Cekap dalam C Menggunakan Teknik Terbukti?Artikel seterusnya：Bagaimanakah Saya Boleh Melaksanakan Mesin Negeri dengan Cekap dalam C Menggunakan Teknik Terbukti?

Artikel berkaitan

Lihat lagi