Heim >Backend-Entwicklung >Python-Tutorial >Wie entferne ich aufeinanderfolgende Duplikate in einer Pandas-Serie?

Wie entferne ich aufeinanderfolgende Duplikate in einer Pandas-Serie?

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-13 01:49:02458Durchsuche

How to Remove Consecutive Duplicates in a Pandas Series?

Löschen aufeinanderfolgender Duplikate in Pandas

Um aufeinanderfolgende Duplikate aus einer Pandas-Serie zu entfernen, können verschiedene Methoden angewendet werden.

Methode 1: Shift verwenden

Der effizienteste Ansatz besteht darin, die Funktion „shift()“ zu nutzen:

a.loc[a.shift() != a]

Diese Methode vergleicht die Serie mit ihrer eigenen verschobenen Version. Erstellen einer booleschen Maske, in der aufeinanderfolgende Duplikate identifiziert werden.

Methode 2: Verwenden von Diff

Eine alternative Methode ist die Verwendung der diff()-Funktion:

a.loc[a.diff() != 0]

Dieser Ansatz ist jedoch bei großen Datensätzen etwas langsamer.

Aktualisierung:

Es ist wichtig zu beachten, dass die Verwendung von „shift()“ mit einem Standardzeitraum von 1 entspricht Shift(1). Daher erzeugt der folgende Code auch die gewünschte Ausgabe:

a.loc[a.shift(1) != a]

Durch die Verwendung dieser Methoden können Sie aufeinanderfolgende Duplikate effektiv aus Pandas-Serien entfernen und so sicherstellen, dass nur unterschiedliche Werte beibehalten werden.

Das obige ist der detaillierte Inhalt vonWie entferne ich aufeinanderfolgende Duplikate in einer Pandas-Serie?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn