Heim > Artikel > Backend-Entwicklung > Wie extrahiere ich Zeilen mit unterschiedlichen Werten in einem Pandas DataFrame?
Abruf eindeutiger Wertezeilen
Um Zeilen basierend auf eindeutigen Werten innerhalb einer Spalte, insbesondere COL2, zu extrahieren, können die folgenden Methoden verwendet werden:
drop_duplicates with Keep First:
df = df.drop_duplicates('COL2', keep='first')
Dadurch bleibt das erste Vorkommen jedes eindeutigen Werts in COL2 erhalten.
drop_duplicates with Keep Last:
df = df.drop_duplicates('COL2', keep='last')
Dadurch bleibt das letzte Vorkommen jedes eindeutigen Werts in COL2 erhalten.
drop_duplicates with No Keep:
df = df.drop_duplicates('COL2', keep=False)
Dadurch werden alle doppelten Zeilen entfernt, was nur zu eindeutigen Werten in COL2 führt.
Beispiel:
Betrachten Sie den folgenden Datenrahmen:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
e.com | 45 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
Die Verwendung der keep_first-Methode erzeugt:
COL1 | COL2 |
---|---|
a.com | 22 |
b.com | 45 |
c.com | 34 |
f.com | 56 |
Die keep_last-Methode ergibt:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
g.com | 22 |
h.com | 45 |
Zuletzt erzeugt die Verwendung der keep_false-Methode Folgendes:
COL1 | COL2 |
---|---|
c.com | 34 |
f.com | 56 |
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Zeilen mit unterschiedlichen Werten in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!