La réinterprétation des conversions entre les pointeurs vectoriels matériels SIMD et les types correspondants est-elle un comportement non défini en C ?-C++-php.cn

La réinterprétation des conversions entre les pointeurs vectoriels matériels SIMD et les types correspondants est-elle un comportement non défini en C ?

DDD

Dec 27, 2024 pm 02:38 PM

Is Reinterpreting Casts Between Hardware SIMD Vector Pointers and Corresponding Types Undefined Behavior in C ?

La réinterprétation de la diffusion entre le pointeur vectoriel SIMD matériel et le type correspondant est-elle un comportement non défini ?

En C, est-il permis de réinterpréter_cast un float à un __m256 et accédez aux objets flottants via un pointeur différent type ?

L'exemple de code suivant illustre ceci :

#include <immintrin.h>

constexpr size_t _m256_float_step_sz = sizeof(__m256) / sizeof(float);
alignas(__m256) float stack_store[100 * _m256_float_step_sz ]{};
__m256& hwvec1 = *reinterpret_cast<__m256>(&stack_store[0 * _m256_float_step_sz]);

using arr_t = float[_m256_float_step_sz];
arr_t& arr1 = *reinterpret_cast<float>(&hwvec1);</float></__m256></immintrin.h>

Hwvec1 et arr1 ont-ils des comportements non définis ? Les règles strictes d'alias sont-elles violées ([basic.lval]/11) ? Alternativement, existe-t-il une seule manière intrinsèque définie :

__m256 hwvec2 = _mm256_load_ps(&stack_store[0 * _m256_float_step_sz]);
_mm256_store_ps(&stack_store[1 * _m256_float_step_sz], hwvec2);

Réponse :

ISO C ne définit pas __m256, nous devons donc examiner ce qui définit leur comportement sur les implémentations qui les supportent. Les valeurs intrinsèques d'Intel définissent les pointeurs vectoriels comme __m256 comme étant autorisés à créer un alias, de la même manière que l'ISO C définit char comme étant autorisé à créer un alias. (Mais pas l'inverse : c'est UB et c'est une pratique courante de pointer un int* sur un __m256i et de le déréférencer.)

Alors oui, il est prudent de déréférencer un __m256 au lieu d'utiliser un _mm256_load_ps( ) charge alignée intrinsèque. Mais surtout pour float/double, il est souvent plus facile d'utiliser les intrinsèques car ils s'occupent également du casting depuis float. Pour les entiers, les intrinsèques de chargement/stockage AVX512 sont définis comme prenant void mais AVX2 et les versions antérieures ont besoin d'un cast comme (__m256i)&arr[i] qui est une conception d'API assez maladroite et encombre le code qui l'utilise.

Quelques éléments intrinsèques non-AVX512 ont également été ajoutés en utilisant void comme movd/movq charge/stocke l'alignement et l'alias des intrinsèques sûrs tels que _mm_loadu_si32(void). Auparavant, je pense qu'Intel supposait que vous utiliseriez _mm_cvtsi32_si128, ce qui nécessitait de charger vous-même un int en toute sécurité, ce qui signifiait utiliser memcpy pour éviter UB (au moins sur les compilateurs autres que ICC et MSVC classiques, s'ils autorisent des int* non alignés et n'appliquent pas de règles strictes. aliasing).

Cela aurait pu se produire à l'époque où Intel a commencé à envisager de migrer vers LLVM pour ICX/ICPX/OneAPI, et réaliser à quel point il était compliqué de gérer des charges étroites sur les compilateurs qui appliquent un alias strict.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Utilisation de XML en C: un guide des bibliothèques et des outilsMay 09, 2025 am 12:16 AM

XML est utilisé en C car il fournit un moyen pratique de structurer les données, en particulier dans les fichiers de configuration, le stockage de données et les communications réseau. 1) Sélectionnez la bibliothèque appropriée, telle que TinyXML, PUGIXML, RapidXML et décider en fonction des besoins du projet. 2) Comprendre deux façons d'analyse et de génération XML: DOM convient à l'accès et à la modification fréquents, et le sax convient aux fichiers volumineux ou aux données de streaming. 3) Lors de l'optimisation des performances, TinyXML convient aux petits fichiers, PUGIXML fonctionne bien en mémoire et en vitesse, et RapidXML est excellent dans le traitement des fichiers volumineux.

C # et C: Explorer les différents paradigmesMay 08, 2025 am 12:06 AM

Les principales différences entre C # et C sont la gestion de la mémoire, la mise en œuvre du polymorphisme et l'optimisation des performances. 1) C # utilise un collecteur de déchets pour gérer automatiquement la mémoire, tandis que C doit être géré manuellement. 2) C # réalise le polymorphisme à travers des interfaces et des méthodes virtuelles, et C utilise des fonctions virtuelles et des fonctions virtuelles pures. 3) L'optimisation des performances de C # dépend de la structure et de la programmation parallèle, tandis que C est implémenté via des fonctions en ligne et du multithreading.

C Analyse XML: techniques et meilleures pratiquesMay 07, 2025 am 12:06 AM

Les méthodes DOM et SAX peuvent être utilisées pour analyser les données XML dans C. 1) DOM L'analyse DOM charge XML dans la mémoire, adaptée aux petits fichiers, mais peut prendre beaucoup de mémoire. 2) L'analyse du sax est motivée par des événements et convient aux fichiers volumineux, mais ne peut être accessible au hasard. Le choix de la bonne méthode et l'optimisation du code peuvent améliorer l'efficacité.

C dans des domaines spécifiques: explorer ses bastionsMay 06, 2025 am 12:08 AM

C est largement utilisé dans les domaines du développement de jeux, des systèmes intégrés, des transactions financières et de l'informatique scientifique, en raison de ses performances et de sa flexibilité élevées. 1) Dans le développement de jeux, C est utilisé pour un rendu graphique efficace et l'informatique en temps réel. 2) Dans les systèmes embarqués, la gestion de la mémoire de C et les capacités de contrôle du matériel en font le premier choix. 3) Dans le domaine des transactions financières, la performance élevée de C répond aux besoins de l'informatique en temps réel. 4) Dans l'informatique scientifique, les capacités de mise en œuvre de l'algorithme efficace de C et de traitement des données sont pleinement reflétées.

Debunking the Mythes: C est-il vraiment une langue morte?May 05, 2025 am 12:11 AM

C n'est pas mort, mais a prospéré dans de nombreux domaines clés: 1) le développement de jeux, 2) la programmation du système, 3) l'informatique haute performance, 4) les navigateurs et les applications réseau, C est toujours le choix grand public, montrant ses fortes scénarios de vitalité et d'application.

C # vs C: Une analyse comparative des langages de programmationMay 04, 2025 am 12:03 AM

Les principales différences entre C # et C sont la syntaxe, la gestion de la mémoire et les performances: 1) la syntaxe C # est moderne, prend en charge Lambda et Linq, et C conserve les fonctionnalités C et prend en charge les modèles. 2) C # gère automatiquement la mémoire, C doit être géré manuellement. 3) Les performances C sont meilleures que C #, mais les performances C # sont également en cours d'optimisation.

Construire des applications XML avec C: Exemples pratiquesMay 03, 2025 am 12:16 AM

Vous pouvez utiliser les bibliothèques TinyXML, PUGIXML ou LIBXML2 pour traiter les données XML dans C. 1) Parse Fichiers XML: utilisez des méthodes DOM ou SAX, DOM convient aux petits fichiers et SAX convient aux fichiers volumineux. 2) Générez le fichier XML: convertissez la structure de données au format XML et écrivez dans le fichier. Grâce à ces étapes, les données XML peuvent être gérées et manipulées efficacement.

XML en C: Gestion des structures de données complexesMay 02, 2025 am 12:04 AM

Travailler avec des structures de données XML en C peut utiliser la bibliothèque TinyXML ou PUGIXML. 1) Utilisez la bibliothèque PUGIXML pour analyser et générer des fichiers XML. 2) Gérer les éléments XML imbriqués complexes, tels que les informations du livre. 3) Optimiser le code de traitement XML, et il est recommandé d'utiliser des bibliothèques efficaces et des analyses de streaming. Grâce à ces étapes, les données XML peuvent être traitées efficacement.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semainesByDDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

Blue Prince: Comment se rendre au sous-sol

1 Il y a quelques moisByDDD

Nordhold: Système de fusion, expliqué

3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel