Maison >développement back-end >Tutoriel Python >Comment convertir efficacement des données catégorielles en indices numériques dans Pandas ?

Comment convertir efficacement des données catégorielles en indices numériques dans Pandas ?

Mary-Kate Olsen
Mary-Kate Olsenoriginal
2024-10-29 04:43:02509parcourir

How to efficiently convert categorical data to numerical indices in Pandas?

Pandas : conversion de catégories en indices numériques

Pour convertir les catégories d'une trame de données Pandas en indices numériques, nous pouvons suivre la méthode efficace fournie par un utilisateur :

Étape 1 : Catégoriser la colonne
Tout d'abord, convertissez la colonne cible (dans ce cas, cc) en un type catégoriel :

<code class="python">df.cc = pd.Categorical(df.cc)</code>

Étape 2 : Capturer les codes de catégorie
Créez une nouvelle colonne nommée code pour stocker les codes de catégorie :

<code class="python">df['code'] = df.cc.codes</code>

Résultat :

Le dataframe comprend désormais une colonne de codes avec des indices correspondant aux catégories :

cc temp code
US 37.0 2
CA 12.0 1
US 35.0 2
AU 20.0 0

Options supplémentaires :

  • Pour récupérer les codes sans modifier le DataFrame :
<code class="python">df.cc.astype('category').codes</code>
  • Pour utiliser la colonne catégorielle comme index :
<code class="python">df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)</code>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn