Heim >Backend-Entwicklung >Python-Tutorial >So filtern Sie Daten in Pandas
Methoden zum Filtern von Pandas: 1. Importieren Sie die Daten. 3. Sortieren Sie die Daten. 5. Gruppieren und aggregieren Sie die Daten. Detaillierte Einführung: 1. Stellen Sie zunächst sicher, dass die Pandas-Bibliothek installiert ist. Wenn sie nicht installiert ist, können Sie sie mit dem Befehl „pip install pandas“ installieren pd“-Befehl zum Importieren der Pandas-Bibliothek; 2. Lesen Sie Daten mithilfe der Pandas-Bibliothek und mehr.
Das Betriebssystem dieses Tutorials: Windows 10-System, DELL G3-Computer.
Pandas ist eine beliebte Python-Datenanalysebibliothek, die viele leistungsstarke Funktionen bietet, mit denen Sie Daten einfach filtern, verarbeiten und analysieren können. Hier sind einige gängige Möglichkeiten, Pandas zum Filtern von Daten zu verwenden:
1. Importieren Sie die Pandas-Bibliothek.
Stellen Sie zunächst sicher, dass die Pandas-Bibliothek installiert ist. Wenn es nicht installiert ist, können Sie es mit dem folgenden Befehl installieren:
pip install pandas
Anschließend importieren Sie die Pandas-Bibliothek:
import pandas as pd
2. Daten lesen
Verwenden Sie die Funktion read_csv() in der Pandas-Bibliothek, um die CSV-Datei zu lesen und die Funktion read_excel() zum Lesen von Excel-Dateien usw. Lesen Sie beispielsweise eine CSV-Datei mit dem Namen data.csv:
df = pd.read_csv('data.csv')
3. Daten filtern
Pandas bietet verschiedene Methoden zum Filtern von Daten. Im Folgenden sind einige gängige Methoden aufgeführt:
(1) Filtern basierend auf Bedingungen
Verwenden Sie loc- und iloc-Attribute und logische Operatoren (wie &, |, ~ usw.), um Daten zu filtern. Um beispielsweise Daten zu filtern, deren Alter mindestens 18 Jahre beträgt und deren Geschlecht weiblich ist:
df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
(2) Filtern basierend auf Tags
Verwenden Sie das loc-Attribut, um Daten nach bestimmten Tags zu filtern. Filtern Sie beispielsweise Daten mit dem Nachnamen „Zhang“:
df.loc[df['last_name'] == '张']
(3) Nach Bereich filtern
Verwenden Sie das loc-Attribut, um Daten innerhalb eines bestimmten Bereichs zu filtern. Filtern Sie beispielsweise Daten im Alter zwischen 18 und 30 Jahren:
df.loc[(df['age'] >= 18) & (df['age'] <= 30)]
(4) Nach mehreren Bedingungen filtern
Verwenden Sie die Abfragemethode, um Daten zu filtern, die mehrere Bedingungen erfüllen. Filtern Sie beispielsweise Daten, deren Alter mindestens 18 Jahre beträgt und deren Geschlecht weiblich ist:
df.query('age >= 18 & gender == "female"')
4. Sortieren Sie Daten
Verwenden Sie die Methode sort_values(), um die Daten zu sortieren. Sortieren Sie zum Beispiel nach Alter in aufsteigender Reihenfolge:
df.sort_values('age', ascending=True)
5 Gruppieren und aggregieren Sie Daten
Verwenden Sie die Methode „groupby()“, um die Daten zu gruppieren, und verwenden Sie Aggregatfunktionen (wie „sum()“, „mean()“, „count()“. usw.), um jede Gruppenberechnung zu gruppieren. Berechnen Sie beispielsweise das Durchschnittsalter jeder Geschlechtergruppe:
df.groupby('gender').mean()['age']
Das obige ist der detaillierte Inhalt vonSo filtern Sie Daten in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!