Heim >Backend-Entwicklung >Python-Tutorial >Meistern Sie den Trick, Spaltennamen in Pandas zu ändern: ein unverzichtbares Werkzeug für die Datenanalyse

Meistern Sie den Trick, Spaltennamen in Pandas zu ändern: ein unverzichtbares Werkzeug für die Datenanalyse

PHPz
PHPzOriginal
2024-01-13 13:20:06754Durchsuche

Meistern Sie den Trick, Spaltennamen in Pandas zu ändern: ein unverzichtbares Werkzeug für die Datenanalyse

Datenanalysetool: Beherrschen Sie die Fähigkeiten zum Ändern von Spaltennamen in Pandas

Einführung:

Während des Datenanalyseprozesses stoßen wir häufig auf Situationen, in denen wir die Spaltennamen des Datensatzes ändern müssen. Pandas ist eine häufig verwendete Datenverarbeitungsbibliothek in Python, die flexible und leistungsstarke Funktionen zum Verarbeiten und Analysieren von Daten bietet. Heute konzentrieren wir uns auf die Techniken zum Ändern von Spaltennamen in Pandas und demonstrieren sie anhand spezifischer Codebeispiele.

1. Sehen Sie sich die vorhandenen Spaltennamen an

Zuerst müssen wir die Spaltennamen des aktuellen Datensatzes verstehen. Verwenden Sie in Pandas df.columns, um die Spaltennamen des DataFrame anzuzeigen. Zum Beispiel haben wir den folgenden Datenrahmen df: df.columns可以查看数据框(DataFrame)的列名。例如,我们有如下数据框df:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

我们可以使用df.columns

print(df.columns)

Wir können df.columns verwenden, um die Spaltennamen von df anzuzeigen:

Index(['A', 'B', 'C'], dtype='object')

Die laufenden Ergebnisse lauten wie folgt:

df.columns = ['New_A', 'B', 'C']

2. Ändern Sie die Spaltennamen
  1. Spaltennamen direkt ändern

In Pandas können wir Spaltennamen direkt ändern, indem wir Werte zuweisen. Zum Beispiel möchten wir den Spaltennamen „A“ in „Neu_A“ ändern:

print(df.columns)

Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:

Index(['New_A', 'B', 'C'], dtype='object')

Die laufenden Ergebnisse lauten wie folgt:

df = df.rename(columns={'B': 'New_B'})

Auf diese Weise haben wir kann alle erforderlichen Änderungen vornehmen. Die Spaltennamen werden alle auf einmal geändert.
  1. Verwenden Sie die Funktion rename(), um Spaltennamen zu ändern

Neben der direkten Zuweisung von Werten zum Ändern von Spaltennamen bietet Pandas auch die Funktion rename() zum Ändern von Spaltennamen. Diese Methode ist flexibler und wir können einige Spaltennamen selektiv ändern. Wenn wir beispielsweise den Spaltennamen „B“ in „Neu_B“ ändern, können wir den folgenden Code verwenden:

print(df.columns)

Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:

Index(['New_A', 'New_B', 'C'], dtype='object')

Das Ergebnis der Ausführung lautet wie folgt:

df.columns = df.columns.map(lambda x: 'New_' + x)

Auf diese Weise ändern wir nur den angegebenen Spaltennamen, ohne dass sich dies auf die Benennung anderer Spaltennamen auswirkt.
  1. Verwenden Sie die Funktion „map()“, um einen Teil des Spaltennamens zu ändern.

Manchmal müssen wir den Spaltennamen möglicherweise teilweise ändern, z. B. durch Hinzufügen eines Präfixes vor dem Spaltennamen. Verwenden Sie die Funktion „map()“, um Teilspaltennamen zu bearbeiten. Wenn wir beispielsweise das Präfix „New_“ vor dem Spaltennamen hinzufügen, können wir den folgenden Code verwenden:

print(df.columns)

Überprüfen Sie nach dem Ausführen den Spaltennamen von df erneut:

Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')

Das Ergebnis der Ausführung lautet wie folgt:

rrreee

Auf diese Weise können wir die Spalten vergleichen und flexible Teiländerungen am Namen vornehmen.

3. Anwendungsszenarien

Die Beherrschung der Fähigkeiten zum Ändern von Spaltennamen in Pandas ist für Datenanalyseaufgaben sehr wichtig. Im Folgenden finden Sie Beispiele für verschiedene Anwendungsszenarien:
  1. Datenbereinigung: Während des Datenbereinigungsprozesses ist es häufig erforderlich, Spaltennamen zu standardisieren und nicht standardmäßige Spaltennamen in einheitliche Benennungsstandards umzuwandeln.
  2. Datenzusammenführung: Wenn Sie die Funktion merge() oder join() zum Zusammenführen von Daten verwenden, ist es häufig erforderlich, die Namen der zusammengeführten Spalten zu ändern, um Spalten aus verschiedenen Datenquellen zu unterscheiden.
  3. Datenexport: Beim Exportieren von Daten in Excel- oder CSV-Dateien können wir die Spaltennamen ändern, um sie aussagekräftiger zu gestalten und die Lesbarkeit der Datei zu verbessern.

Zusammenfassung:

Durch die Einleitung dieses Artikels haben wir die Techniken zum Ändern von Spaltennamen in Pandas kennengelernt und sie anhand spezifischer Codebeispiele demonstriert. Die Beherrschung dieser Fähigkeiten kann uns helfen, Spaltennamen während des Datenanalyseprozesses flexibler zu ändern und die Effizienz der Datenverarbeitung und -analyse zu verbessern. Gleichzeitig trägt eine sinnvolle Spaltenbenennung auch zur Verbesserung der Lesbarkeit und Verständlichkeit der Daten bei und ist sehr hilfreich bei der Interpretation und visuellen Darstellung der Ergebnisse der Datenanalyse. Ich hoffe, dieser Artikel wird Ihnen bei Ihrer Datenanalyse hilfreich sein. Vielen Dank fürs Lesen! 🎜

Das obige ist der detaillierte Inhalt vonMeistern Sie den Trick, Spaltennamen in Pandas zu ändern: ein unverzichtbares Werkzeug für die Datenanalyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn