Heim  >  Artikel  >  Backend-Entwicklung  >  Wie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?

Wie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-04 04:11:30512Durchsuche

How to Retrieve Rows with Unique Values in a Pandas DataFrame?

Zeilen anhand eindeutiger Spaltenwerte abrufen: Eine umfassende Anleitung

Viele Programmierszenarien erfordern das Extrahieren von Zeilen basierend auf eindeutigen Werten in bestimmten Spalten. In diesem Artikel wird erläutert, wie Sie dies mithilfe der weit verbreiteten Pandas-Bibliothek in Python erreichen können.

Abfrage:

Betrachten Sie einen Datensatz mit zwei Spalten, COL1 und COL2, wie gezeigt unten:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

Das Ziel besteht darin, nur die Zeilen abzurufen, in denen COL2 eindeutige Werte enthält. Die erwartete Ausgabe ist:

COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56

Lösung:

Die Methode drop_duplicates in Pandas bietet eine einfache Möglichkeit, doppelte Zeilen basierend auf einer oder mehreren Spalten zu entfernen. So nutzen Sie es für diese spezielle Aufgabe:

<code class="python">import pandas as pd

df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'],
                  'COL2': [22, 45, 34, 45, 56, 22, 45]})

# Keep only the first occurrence of each unique value in COL2
df = df.drop_duplicates('COL2')

print(df)</code>

Ausgabe:

  COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

Zusätzliche Optionen:

Die Methode drop_duplicates bietet zusätzliche Optionen Optionen zum Anpassen der Handhabung von Duplikaten:

  • keep='last': Behalten Sie das letzte Vorkommen jedes eindeutigen Werts bei.
  • keep=False : Alle doppelten Zeilen vollständig entfernen.

Hier sind Beispiele, die diese Optionen veranschaulichen:

<code class="python"># Keep only the last occurrence of each unique value in COL2
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicate rows from the dataset
df = df.drop_duplicates('COL2', keep=False)</code>

Das obige ist der detaillierte Inhalt vonWie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn