Maison > Article > développement back-end > Maîtrisez l'astuce de la modification des noms de colonnes dans Pandas : un outil essentiel pour l'analyse des données
Outil d'analyse de données : Maîtrisez les compétences de modification des noms de colonnes dans Pandas
Introduction :
Pendant le processus d'analyse des données, nous rencontrons souvent des situations où nous devons modifier les noms de colonnes de l'ensemble de données. Pandas est une bibliothèque de traitement de données couramment utilisée en Python, fournissant des fonctions flexibles et puissantes pour traiter et analyser les données. Aujourd'hui, nous allons nous concentrer sur les techniques de modification des noms de colonnes dans Pandas et les démontrer avec des exemples de code spécifiques.
1. Afficher les noms de colonnes existants
Tout d'abord, nous devons comprendre les noms de colonnes de l'ensemble de données actuel. Dans Pandas, utilisez df.columns
pour afficher les noms de colonnes du DataFrame. Par exemple, nous avons le bloc de données df suivant : df.columns
可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data)
我们可以使用df.columns
print(df.columns)Nous pouvons utiliser
df.columns
pour afficher les noms de colonnes de df : Index(['A', 'B', 'C'], dtype='object')Les résultats d'exécution sont les suivants :
df.columns = ['New_A', 'B', 'C']2. Modifier les noms de colonnes
print(df.columns)Après l'exécution, vérifiez à nouveau le nom de la colonne de df :
Index(['New_A', 'B', 'C'], dtype='object')Les résultats d'exécution sont les suivants :
df = df.rename(columns={'B': 'New_B'})De cette façon, nous peut modifier tout ce qui est nécessaire. Les noms de colonnes sont tous modifiés en même temps.
print(df.columns)Après l'exécution, vérifiez à nouveau le nom de la colonne de df :
Index(['New_A', 'New_B', 'C'], dtype='object')Le résultat de l'exécution est le suivant :
df.columns = df.columns.map(lambda x: 'New_' + x)De cette façon, nous modifions uniquement le nom de la colonne spécifié sans affecter le nom des autres noms de colonnes.
print(df.columns)Après l'exécution, vérifiez à nouveau le nom de la colonne de df :
Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')Le résultat de l'exécution est le suivant :
rrreee
De cette façon, nous pouvons comparer les colonnes. Apporter des modifications partielles flexibles au nom. 3. Scénarios d'application Maîtriser les compétences de modification des noms de colonnes dans Pandas est très important pour les tâches d'analyse de données. Voici des exemples de plusieurs scénarios d'application :Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!