Heim  >  Artikel  >  Backend-Entwicklung  >  Tutorial zum Löschen von Zeilendaten mit Pandas

Tutorial zum Löschen von Zeilendaten mit Pandas

WBOY
WBOYOriginal
2024-01-09 14:33:534736Durchsuche

Tutorial zum Löschen von Zeilendaten mit Pandas

Pandas-Tutorial: So verwenden Sie Pandas zum Löschen von Zeilendaten. Es sind spezifische Codebeispiele erforderlich.

Einführung:
Bei der Datenanalyse und -verarbeitung müssen Daten häufig bereinigt und verarbeitet sowie unnötige oder ungültige Zeilendaten gelöscht werden Der Datensatz ist eine häufige Operation. In Python bietet die Pandas-Bibliothek leistungsstarke Tools zur Datenbearbeitung. In diesem Artikel wird erläutert, wie Pandas zum Löschen von Zeilendaten verwendet werden, und es werden spezifische Codebeispiele gegeben.

  1. Pandas-Bibliothek importieren
    Bevor Sie beginnen, müssen Sie zunächst die Pandas-Bibliothek importieren.

Pandas als PD importieren

  1. Beispieldaten erstellen
    Zur Veranschaulichung erstellen wir zunächst Beispieldaten, die einige Datenzeilen enthalten. Der folgende Code erstellt ein DataFrame-Objekt mit dem Namen „data“ und fügt einige Datenzeilen hinzu.

data = {'Name': ['Zhang San', 'Li Si', 'Wang Wu', 'Zhao Liu', 'Liu Qi'],

    '年龄': [20, 25, 30, 35, 40],
    '性别': ['男', '男', '女', '男', '女']}

df = pd.DataFrame(data)

print("Originaldaten:")
print(df)

Ausgabeergebnis:
Originaldaten:
Name Alter Geschlecht
0 Zhang San 20 männlich
1 Li Si 25 männlich
2 Wang Wu 30 weiblich
3 Zhao Liu 35 männlich
4 Liu Qi 40 weiblich

  1. Bedingungen zum Löschen von Zeilendaten verwenden
    pandas bietet eine Vielzahl von Methoden zum Löschen von Zeilendaten. Die gebräuchlichste Methode besteht darin, Zeilen über Bedingungen zu löschen, d. h. nur Zeilendaten zu löschen, die bestimmte Bedingungen erfüllen. Der folgende Beispielcode zeigt, wie Zeilen mit einem Alter größer oder gleich 30 gelöscht werden.

df = df[df['age']

print("Daten mit Alter größer oder gleich 30 löschen:")
print(df)

Ausgabeergebnis:
Daten mit Alter löschen größer oder gleich 30:
Name Alter Geschlecht
0 Zhang San 20 männlich
1 Li Si 25 männlich

  1. Index zum Löschen von Zeilendaten verwenden
    Neben der Verwendung von Bedingungen zum Löschen können Sie auch den Index zum Löschen von Zeilen verwenden Der Datensatz. Durch Angabe der Indexbezeichnung der Zeile können Pandas die angegebene Datenzeile problemlos löschen. Der folgende Beispielcode zeigt, wie die erste und die letzte Datenzeile gelöscht werden.

df = df.drop([0, 4])

print("Erste und letzte Datenzeile löschen:")
print(df)

Ausgabeergebnis:
Erste und letzte Datenzeile löschen:
Name Alter Geschlecht
1 Li Si 25 männlich
2 Wang Wu 30 weiblich
3 Zhao Liu 35 männlich

  1. Zeilennummer zum Löschen von Zeilendaten verwenden
    Zusätzlich zur Verwendung von Index-Tags können Sie auch Zeilennummern zum Löschen von Zeilendaten verwenden . Pandas bietet die Methode „iloc“, mit der bestimmte Zeilendaten durch Festlegen der Zeilennummer gelöscht werden können. Der folgende Beispielcode zeigt, wie die zweite und dritte Datenzeile gelöscht werden.

df = df.drop(df.index[[1, 2]])

print("Daten in der zweiten und dritten Zeile löschen:")
print(df)

Ausgabeergebnis:
Daten löschen in der zweiten und dritten Zeile:
Name Alter Geschlecht
0 Zhang San 20 männlich
3 Zhao Liu 35 männlich

  1. Ändern Sie die Originaldaten
    Im obigen Beispiel erfolgt das Löschen von Zeilendaten auf einer Kopie des DataFrame-Objekts Originaldaten werden nicht verändert. Wenn Sie die Originaldaten ändern möchten, müssen Sie einen zusätzlichen Parameter „inplace=True“ hinzufügen. Der folgende Beispielcode zeigt, wie Zeilen, die eine Bedingung erfüllen, direkt in den Originaldaten gelöscht werden.

df.drop(df[df['age'] >= 30].index, inplace=True)

print("Daten mit einem Alter größer oder gleich 30 direkt aus den Originaldaten löschen:" )
print( df)

Ergebnisse ausgeben:
Daten mit einem Alter größer oder gleich 30 direkt in den Originaldaten löschen:
Name Alter Geschlecht
0 Zhang San 20 männlich
1 Li Si 25 männlich

Schlussfolgerung:
Von Mit der Pandas-Bibliothek und dem obigen Codebeispiel können wir die Zeilendaten im DataFrame-Objekt einfach löschen. Durch Bedingungen, Indexbezeichnungen oder Zeilennummern können wir Datenzeilen, die bestimmte Bedingungen erfüllen, selektiv löschen. Dadurch stehen uns sehr praktische Tools und Methoden zur Datenbereinigung und -verarbeitung zur Verfügung.

Das obige ist der detaillierte Inhalt vonTutorial zum Löschen von Zeilendaten mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn