Heim > Artikel > Backend-Entwicklung > Wie behebe ich „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich' in Pandas?
Verstehen von „ValueError: Neuindizierung von einer doppelten Achse nicht möglich“
In Pandas bezieht sich Neuindizierung auf den Vorgang des Änderns der Zeilen- oder Spaltenbeschriftungen eines DataFrames. Wenn eine Neuindizierung versucht wird und eine doppelte Achse gefunden wird, wird der Fehler „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich“ ausgelöst.
Erklärung
Dieser Fehler tritt normalerweise auf tritt auf, wenn Sie einem DataFrame eine neue Zeile oder Spalte zuweisen, deren Index (Zeilenbeschriftungen) oder Spalten (Spaltenbeschriftungen) doppelte Werte enthalten.
Im Kontext Ihrer Frage weisen Sie eine neue Zeile mit dem Namen „sums“ zu ' zum affinity_matrix DataFrame. Der Fehler deutet jedoch darauf hin, dass die Spalten von affinity_matrix möglicherweise doppelte Werte enthalten. Dies ist wahrscheinlich die Ursache des Problems.
Beispiel
Betrachten Sie den folgenden DataFrame mit Zeichenfolgenbeschriftungszeilen und Ganzzahlbeschriftungsspalten:
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], index=["a", "b", "c"], columns=[1, 2, 2])
In diesem DataFrame erscheint Spalte 2 zweimal. Wenn wir versuchen, eine neue Zeile mit dem Namen „Summe“ zuzuweisen, indem wir die Werte in jeder Spalte summieren, wird derselbe Fehler auftreten:
df.loc['sum'] = df.sum(axis=0)
ValueError: cannot reindex from a duplicate axis
Dieser Fehler tritt auf, weil der DataFrame bereits eine Spalte mit der Bezeichnung hat „2“, und der Versuch, daraus eine Neuindizierung durchzuführen, würde zu einer mehrdeutigen Zuweisung führen.
Lösung des Problems
Um dieses Problem zu beheben, müssen Sie überprüfen, ob die Indizes oder Spaltenbeschriftungen Ihres DataFrame enthalten keine doppelten Werte. Wenn dies der Fall ist, können Sie entweder die doppelten Werte entfernen oder sie eindeutig neu kennzeichnen.
Das obige ist der detaillierte Inhalt vonWie behebe ich „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich' in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!