Heim >Backend-Entwicklung >Python-Tutorial >Praktische Tipps und Beispiele zur Pandas-Datenfilterung

Praktische Tipps und Beispiele zur Pandas-Datenfilterung

PHPz
PHPzOriginal
2024-01-24 09:23:151120Durchsuche

Praktische Tipps und Beispiele zur Pandas-Datenfilterung

Praktische Tipps zur Verwendung von Pandas zur Datenfilterung

Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, die in der Datenanalyse und Datenwissenschaft weit verbreitet ist. Die Datenfilterung ist eine häufige Aufgabe bei der Datenverarbeitung. In diesem Artikel wird die Verwendung von Pandas zur Datenfilterung vorgestellt und spezifische Codebeispiele bereitgestellt.

1. Daten basierend auf Bedingungen filtern

  1. Bedingte Operatoren zum Filtern verwenden

Pandas bietet eine Vielzahl von bedingten Operatoren zum Filtern von Daten basierend auf Bedingungen. Zu den häufig verwendeten Operatoren gehören gleich (==), ungleich (!=), größer als (>), kleiner als (=), kleiner als oder gleich (

Angenommen, es gibt ein DataFrame-Objekt df, das den Namen, das Alter und die Punktzahl der Schüler enthält. Wir können den folgenden Code verwenden, um Schülerdaten mit einer Punktzahl von mehr als oder gleich 90 Punkten herauszufiltern:

df_filtered = df[df['score'] >= 90]
  1. Filter Verwendung mehrerer Bedingungen

Zusätzlich zu einer einzelnen Bedingung unterstützt Pandas auch die Verwendung mehrerer Bedingungen für die Datenfilterung. Bedingungen können mit den logischen Operatoren und, oder und nicht verknüpft werden.

Angenommen, wir möchten die Daten von Schülern herausfiltern, die zwischen 18 und 25 Jahre alt sind und eine Punktzahl von mindestens 80 Punkten haben. Sie können den folgenden Code verwenden:

df_filtered = df[(df['age'] >= 18) & (df['age'] <= 25) & (df['score'] >= 80)]

2. Filtern Sie die Daten basierend auf index

Das DataFrame-Objekt in Pandas wird standardmäßig automatisch generiert. Ein ganzzahliger Index kann zur Datenfilterung verwendet werden.

  1. Filtern mithilfe des Positionsindex

Sie können das iloc-Attribut verwenden, um Daten basierend auf dem Positionsindex von Zeilen und Spalten zu filtern.

Angenommen, wir möchten beispielsweise die Daten aus den Zeilen 2 bis 5 herausfiltern, können Sie den folgenden Code verwenden:

df_filtered = df.iloc[2:6, :]
  1. Label-Index zum Filtern verwenden

Wenn der Label-Index im DataFrame-Objekt festgelegt ist, Sie Sie können das loc-Attribut verwenden, um Daten basierend auf dem Tag-Index zu filtern.

Angenommen, wir möchten die Daten von Schülern herausfiltern, die 20 Jahre oder älter sind, können Sie den folgenden Code verwenden:

df_filtered = df.loc[df['age'] >= 20, :]

3 Filtern Sie Daten basierend auf Feldern

Zusätzlich zum Filtern mithilfe von Bedingungen und Indizes. Sie können Daten auch nach Feldern filtern.

  1. Daten basierend auf Spaltennamen filtern

Sie können Spaltennamen verwenden, um bestimmte Spaltendaten herauszufiltern.

Angenommen, wir möchten beispielsweise nur die Daten in den beiden Spalten Name und Noten herausfiltern, können Sie den folgenden Code verwenden:

df_filtered = df[['name', 'score']]
  1. Daten basierend auf Feldwerten filtern

Sie können den Wert von verwenden Feld, um die dem Feldwert entsprechenden Daten herauszufiltern.

Angenommen, wir möchten Schülerdaten mit Werten zwischen 80 und 90 Punkten herausfiltern, können wir den folgenden Code verwenden:

df_filtered = df[df['score'].between(80, 90)]

Das Obige sind praktische Tipps für die Verwendung von Pandas zur Datenfilterung durch die flexible Verwendung von Bedingungen, Indizes und Felder können Sie ganz einfach die benötigten Daten herausfiltern. Ich hoffe, dieser Artikel wird Ihnen bei Ihrem Datenverarbeitungsprozess helfen!

Das obige ist der detaillierte Inhalt vonPraktische Tipps und Beispiele zur Pandas-Datenfilterung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn