Maison >développement back-end >Tutoriel Python >Comment combiner différents types de données dans des tableaux NumPy sans perdre l'efficacité de la mémoire ?

Comment combiner différents types de données dans des tableaux NumPy sans perdre l'efficacité de la mémoire ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-10-21 17:55:49409parcourir

How to Combine Different Data Types in NumPy Arrays without Losing Memory Efficiency?

Combinaison de types de données hétérogènes dans des tableaux NumPy

Dans NumPy, il est courant de rencontrer des situations où différents tableaux contenant divers types de données doivent être combiné. Bien que la concaténation de tableaux constitue une solution simple, elle entraîne souvent la conversion de l'intégralité du tableau vers le type de données du premier tableau, ce qui entraîne des inefficacités potentielles de la mémoire.

Pour relever ce défi, envisagez les approches suivantes :

Tableaux d'enregistrement :

Les tableaux d'enregistrement offrent une méthode polyvalente pour stocker des types de données hétérogènes dans un seul tableau sans compromettre l'efficacité de la mémoire. Ils utilisent une structure de type tableau, où chaque colonne représente un champ avec son type de données correspondant. Par exemple, pour combiner un tableau de chaînes (A) avec un tableau d'entiers (B), vous pouvez créer un tableau d'enregistrements comme suit :

<code class="python">records = numpy.rec.fromarrays((A, B), names=('keys', 'data'))</code>

Le tableau d'enregistrements se compose désormais de deux champs : clés ( chaînes) et des données (entiers). Vous pouvez accéder à ces champs individuellement en utilisant l'accès aux attributs, tels que records['keys'] et records['data'].

Tableaux structurés :

Tableaux structurés, similaire aux tableaux d'enregistrement, fournit un moyen de définir des types de données personnalisés pour les tableaux. Au lieu d'utiliser l'accès aux attributs, ils utilisent l'indexation pour accéder à différents champs. Pour créer un tableau structuré :

<code class="python">arr = numpy.array([('a', 0), ('b', 1)], dtype=([('keys', '|S1'), ('data', 'i8')]))</code>

L'argument dtype spécifie un tuple de tuples où chaque tuple définit le nom du champ et le type de données. Le tableau résultant arr contient des champs clés (chaînes) et des données (entiers) accessibles via l'indexation, par exemple arr['keys'] et arr['data'].

Remarque :

Les tableaux structurés n'offrent pas d'accès aux attributs comme les tableaux d'enregistrements. Cependant, ils peuvent être plus efficaces pour certaines opérations grâce à leur approche d’indexation directe. De plus, les tableaux d'enregistrement et les tableaux structurés prennent en charge des opérations telles que le découpage, le masquage et la diffusion, offrant ainsi une flexibilité dans la manipulation des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn