Maison >développement back-end >Tutoriel Python >Comment puis-je convertir un Pandas DataFrame avec des valeurs manquantes en un tableau NumPy à l'aide de « df.to_numpy() » et conserver les types de données ?

Comment puis-je convertir un Pandas DataFrame avec des valeurs manquantes en un tableau NumPy à l'aide de « df.to_numpy() » et conserver les types de données ?

Linda Hamiltonoriginal: 2024-11-06 03:57:02991parcourir

How can I convert a Pandas DataFrame with missing values into a NumPy array using `df.to_numpy()` and preserve data types?

Convertir une trame de données Pandas avec des valeurs manquantes en tableau NumPy

Utiliser df.to_numpy()

Pour convertir une trame de données Pandas avec des valeurs manquantes en un NumPy tableau avec np.nan représentant les valeurs manquantes, utilisez la méthode df.to_numpy(). Il fournit un moyen cohérent et fiable d'obtenir des tableaux NumPy à partir de trames de données et d'objets index/série.

<code class="python">import numpy as np
import pandas as pd

df = pd.DataFrame({
    "A": [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1],
    "B": [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan],
    "C": [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan],
}, index=[1, 2, 3, 4, 5, 6, 7])

np_array = df.to_numpy()
print(np_array)</code>

Cela générera un tableau NumPy avec des valeurs manquantes représentées par np.nan :

[[ nan  0.2  nan]
 [ nan  nan  0.5]
 [ nan  0.2  0.5]
 [ 0.1  0.2  nan]
 [ 0.1  0.2  0.5]
 [ 0.1  nan  0.5]
 [ 0.1  nan  nan]]

Préservation des types de données

Pour conserver les types de données dans le tableau NumPy, utilisez la fonction np.rec.fromrecords() :

<code class="python">v = df.reset_index()
np_array_dtypes = np.rec.fromrecords(v, names=v.columns.tolist())
print(np_array_dtypes)</code>

Cela générera un tableau NumPy avec l'original types de données conservés comme suit :

rec.array([('1', 1, 0.2, 0.5), ('2', 2, np.nan, 0.5), ('3', 3, 0.2, 0.5),
           ('4', 4, 0.2, np.nan), ('5', 5, 0.2, 0.5), ('6', 6, np.nan, 0.5),
           ('7', 7, np.nan, np.nan)],
          dtype=[('index', '<U1'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')])

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

numpy pandas Array using function this

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Comment déterminer la résolution de votre moniteur à l’aide de Python ?Article suivant：Comment déterminer la résolution de votre moniteur à l’aide de Python ?

Articles Liés

Voir plus