Maison >développement back-end >Tutoriel Python >Préservation des types de données dans la concaténation de tableaux NumPy : tableaux d'enregistrement et tableaux structurés

Préservation des types de données dans la concaténation de tableaux NumPy : tableaux d'enregistrement et tableaux structurés

Patricia Arquette
Patricia Arquetteoriginal
2024-10-21 18:00:04537parcourir

Preserving Data Types in NumPy Array Concatenation: Record Arrays vs. Structured Arrays

Concaténer des tableaux NumPy avec différents types de données

Créer un seul tableau NumPy qui combine les données de plusieurs tableaux avec différents types de données peut être un défi. Une approche courante consiste à utiliser la fonction concatenate(), mais cela peut entraîner la conversion de l'ensemble du tableau en un seul type de données, tel qu'une chaîne. Cela peut être inefficace en termes d'utilisation de la mémoire.

Solution : tableaux d'enregistrement

Pour conserver les types de données d'origine lors de la combinaison de tableaux, envisagez d'utiliser un tableau d'enregistrement. Un tableau d'enregistrements vous permet de créer un tableau structuré avec des colonnes nommées, chacune ayant son propre type de données. Cette approche vous permet d'accéder aux colonnes individuelles par leurs noms, tout comme les attributs d'un objet Python.

Pour créer un tableau d'enregistrements, vous pouvez utiliser la fonction rec.fromarrays() du module numpy :

<code class="python">import numpy as np

a = np.array(['a', 'b', 'c', 'd', 'e'])
b = np.arange(5)
records = np.rec.fromarrays((a, b), names=('keys', 'data'))</code>

Ce code crée un tableau d'enregistrements nommé records avec deux colonnes : « clés » avec un type de données chaîne et « données » avec un type de données entier.

Tableaux structurés

Une autre option pour combiner des tableaux avec différents types consiste à créer directement un tableau structuré. Un tableau structuré est similaire à un tableau d'enregistrements mais ne fournit pas d'accès aux attributs aux colonnes individuelles :

<code class="python">arr = np.array([('a', 0), ('b', 1)], 
                dtype=([('keys', '|S1'), ('data', 'i8')]))</code>

Ce code crée un tableau structuré nommé arr avec deux colonnes : "clés" avec un type de données chaîne et "données". ' avec un type de données entier.

Quelle approche est la meilleure ?

La meilleure approche pour votre cas d'utilisation spécifique dépend de vos besoins. Les tableaux d'enregistrements sont plus pratiques à utiliser, surtout si vous devez accéder à des colonnes individuelles par leur nom. Les tableaux structurés sont plus efficaces pour l'utilisation de la mémoire si vous n'avez pas besoin d'accès aux attributs.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn