Heim >Backend-Entwicklung >Python-Tutorial >Wie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?

Wie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?

DDD
DDDOriginal
2024-12-01 21:07:11610Durchsuche

How to Select Pandas DataFrame Rows Based on Complex Multi-Column Criteria?

Auswahl mit komplexen Kriterien aus pandas.DataFrame

Bei der Datenanalyse mit Pandas müssen wir oft bestimmte Zeilen oder Spalten basierend auf komplexen Kriterien auswählen Kriterien. Diese Frage zeigt, wie Werte aus Spalte „A“ ausgewählt werden, vorausgesetzt, die entsprechenden Werte für „B“ und „C“ erfüllen bestimmte Bedingungen.

Um das Problem zu verstehen, erstellen wir einen Beispiel-DataFrame:

import pandas as pd
from random import randint

df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
                   'B': [randint(1, 9)*10 for x in range(10)],
                   'C': [randint(1, 9)*100 for x in range(10)]})

Jetzt wollen wir Werte aus „A“ auswählen, die die folgenden Bedingungen erfüllen:

  • Der entsprechende Wert für „B“ sollte größer sein als 50.
  • Der entsprechende Wert für „C“ sollte nicht gleich 900 sein.

Um dieses Problem zu lösen, können wir die Spaltenoperationen von Pandas verwenden:

df["B"] > 50

Dadurch wird ein boolesches Serienobjekt erstellt, bei dem jedes Element einer Zeile in „B“ entspricht und angibt, ob der jeweilige „B“-Wert größer als ist 50.

(df["B"] > 50) & (df["C"] != 900)

Dies nutzt Broadcasting und logische Operatoren, um die booleschen Serienobjekte zu kombinieren und so eine neue Serie zu erstellen, in der jedes Element angibt, ob die entsprechende Zeile beide Bedingungen erfüllt.

Verwenden dieser Serie als Als Index können wir die „A“-Werte extrahieren:

df["A"][(df["B"] > 50) & (df["C"] != 900)]

Alternativ können wir .loc verwenden Syntax:

df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]

Dieser Ansatz extrahiert effizient Zeilen, die die angegebenen Kriterien erfüllen, und ermöglicht so weitere Analysen oder Operationen an den ausgewählten Daten.

Das obige ist der detaillierte Inhalt vonWie wähle ich Pandas DataFrame-Zeilen basierend auf komplexen mehrspaltigen Kriterien aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:Python Day-Looping-RätselNächster Artikel:Python Day-Looping-Rätsel