Heim > Artikel > Backend-Entwicklung > Wie entferne ich doppelte Spalten in einem Pandas-Datenrahmen?
Doppelte Spalten in einem Pandas-Datenrahmen entfernen
Beim Umgang mit Datenrahmen, die doppelte Spalten enthalten, ist es für effektive Daten erforderlich, diese Redundanzen zu beseitigen Analyse. Dieser Artikel bietet eine umfassende Lösung zum Entfernen doppelter Spalten in Pandas und geht auf alle Aspekte des Problems ein.
Doppelte Spaltennamen
Um Spalten zu entfernen, die ausschließlich auf doppelten Namen basieren, Eine einfache Lösung ist:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Diese Zeile prüft auf doppelte Spaltennamen und behält nur diejenigen bei, die eindeutig sind.
Doppelte Spaltenwerte
Wenn das Ziel darin besteht, Spalten basierend auf doppelten Werten zu entfernen, ist ein anderer Ansatz erforderlich, ohne den Datenrahmen zu transponieren:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Diese Methode prüft auf doppelte Werte innerhalb jeder Spalte und eliminiert Spalten, in denen alle Werte Duplikate sind.
Duplizierte Indizes
Um doppelte Indizes zu entfernen, gehen Sie ähnlich vor:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
Zusätzliche Hinweise
Das obige ist der detaillierte Inhalt vonWie entferne ich doppelte Spalten in einem Pandas-Datenrahmen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!