重新解釋硬體 SIMD 向量指標和對應類型之間的轉換是否是 C 中未定義的行為？-C++-PHP中文網

首頁

後端開發

C++

重新解釋硬體 SIMD 向量指標和對應類型之間的轉換是否是 C 中未定義的行為？

DDD

Dec 27, 2024 pm 02:38 PM

Is Reinterpreting Casts Between Hardware SIMD Vector Pointers and Corresponding Types Undefined Behavior in C ?

硬體 SIMD 向量指標和對應類型之間的重新解釋轉換是否是未定義的行為？

在C 中，是否允許重新解釋_轉換浮點數 到__m256 並透過不同的指標存取浮點物件type?

以下程式碼範例說明了這一點：

#include <immintrin.h>

constexpr size_t _m256_float_step_sz = sizeof(__m256) / sizeof(float);
alignas(__m256) float stack_store[100 * _m256_float_step_sz ]{};
__m256& hwvec1 = *reinterpret_cast<__m256>(&stack_store[0 * _m256_float_step_sz]);

using arr_t = float[_m256_float_step_sz];
arr_t& arr1 = *reinterpret_cast<float>(&hwvec1);</float></__m256></immintrin.h>

hwvec1 和arr1是否有未定義的行為？是否違反了嚴格的別名規則（[basic.lval]/11）？或者，是否只有一個定義的內在方式：

__m256 hwvec2 = _mm256_load_ps(&stack_store[0 * _m256_float_step_sz]);
_mm256_store_ps(&stack_store[1 * _m256_float_step_sz], hwvec2);

答案：

ISO C 沒有定義__m256，所以我們需要看看定義了什麼在支持他們的實現上的行為。 Intel 的內在函數將像 __m256 這樣的向量指標定義為允許為其他任何東西起別名，就像 ISO C 將 char 定義為允許起別名一樣。（但反之亦然：在實踐中將int* 指向__m256i 並取消引用它是UB 和中斷。）

所以，是的，取消引用__m256 是安全的，而不是使用_mm256_load_ps( ) 內在的對齊負載。但特別是對於 float/double，使用內在函數通常更容易，因為它們也負責從 float 進行轉換。對於整數，AVX512 載入/儲存內在函數被定義為採用void，但AVX2 及更早版本需要像(__m256i)&arr[i] 這樣的強制轉換，這是相當笨重的API 設計，並且使用它的程式碼會變得混亂。

也使用 void 增加了一些非 AVX512 內在函數，例如movd/movq 載入/儲存對齊和別名安全內在函數，例如 _mm_loadu_si32(void)。以前我認為英特爾假設你會使用_mm_cvtsi32_si128 ，它需要自己安全地加載一個int ，這意味著使用memcpy 來避免UB （至少在經典ICC 和MSVC 之外的編譯器上，如果它們允許未對齊的int*並且不強制執行嚴格的

這可能是在英特爾開始考慮遷移到LLVM的時候ICX/ICPX / OneAPI，並意識到處理強制嚴格別名的編譯器上的狹窄負載是多麼混亂。

以上是重新解釋硬體 SIMD 向量指標和對應類型之間的轉換是否是 C 中未定義的行為？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

在C中使用XML：庫和工具指南May 09, 2025 am 12:16 AM

在C 中使用XML是因為它提供了結構化數據的便捷方式，尤其在配置文件、數據存儲和網絡通信中不可或缺。 1)選擇合適的庫，如TinyXML、pugixml、RapidXML，根據項目需求決定。 2)了解XML解析和生成的兩種方式：DOM適合頻繁訪問和修改，SAX適用於大文件或流數據。 3)優化性能時，TinyXML適合小文件，pugixml在內存和速度上表現好，RapidXML處理大文件優異。

C＃和C：探索不同的範例May 08, 2025 am 12:06 AM

C#和C 的主要區別在於內存管理、多態性實現和性能優化。 1）C#使用垃圾回收器自動管理內存，C 則需要手動管理。 2）C#通過接口和虛方法實現多態性，C 使用虛函數和純虛函數。 3）C#的性能優化依賴於結構體和並行編程，C 則通過內聯函數和多線程實現。

C XML解析：技術和最佳實踐May 07, 2025 am 12:06 AM

C 中解析XML數據可以使用DOM和SAX方法。 1)DOM解析將XML加載到內存，適合小文件，但可能佔用大量內存。 2)SAX解析基於事件驅動，適用於大文件，但無法隨機訪問。選擇合適的方法並優化代碼可提高效率。

c在特定領域：探索其據點May 06, 2025 am 12:08 AM

C 在遊戲開發、嵌入式系統、金融交易和科學計算等領域中的應用廣泛，原因在於其高性能和靈活性。 1)在遊戲開發中，C 用於高效圖形渲染和實時計算。 2)嵌入式系統中，C 的內存管理和硬件控制能力使其成為首選。 3)金融交易領域，C 的高性能滿足實時計算需求。 4)科學計算中，C 的高效算法實現和數據處理能力得到充分體現。