Heim  >  Artikel  >  Backend-Entwicklung  >  Wie behebe ich „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich“ in Pandas?

Wie behebe ich „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich“ in Pandas?

Patricia Arquette
Patricia ArquetteOriginal
2024-10-23 19:01:02653Durchsuche

How to Resolve

Verstehen von „ValueError: Neuindizierung von einer doppelten Achse nicht möglich“

In Pandas bezieht sich Neuindizierung auf den Vorgang des Änderns der Zeilen- oder Spaltenbeschriftungen eines DataFrames. Wenn eine Neuindizierung versucht wird und eine doppelte Achse gefunden wird, wird der Fehler „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich“ ausgelöst.

Erklärung

Dieser Fehler tritt normalerweise auf tritt auf, wenn Sie einem DataFrame eine neue Zeile oder Spalte zuweisen, deren Index (Zeilenbeschriftungen) oder Spalten (Spaltenbeschriftungen) doppelte Werte enthalten.

Im Kontext Ihrer Frage weisen Sie eine neue Zeile mit dem Namen „sums“ zu ' zum affinity_matrix DataFrame. Der Fehler deutet jedoch darauf hin, dass die Spalten von affinity_matrix möglicherweise doppelte Werte enthalten. Dies ist wahrscheinlich die Ursache des Problems.

Beispiel

Betrachten Sie den folgenden DataFrame mit Zeichenfolgenbeschriftungszeilen und Ganzzahlbeschriftungsspalten:

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], index=["a", "b", "c"], columns=[1, 2, 2])

In diesem DataFrame erscheint Spalte 2 zweimal. Wenn wir versuchen, eine neue Zeile mit dem Namen „Summe“ zuzuweisen, indem wir die Werte in jeder Spalte summieren, wird derselbe Fehler auftreten:

df.loc['sum'] = df.sum(axis=0)
ValueError: cannot reindex from a duplicate axis

Dieser Fehler tritt auf, weil der DataFrame bereits eine Spalte mit der Bezeichnung hat „2“, und der Versuch, daraus eine Neuindizierung durchzuführen, würde zu einer mehrdeutigen Zuweisung führen.

Lösung des Problems

Um dieses Problem zu beheben, müssen Sie überprüfen, ob die Indizes oder Spaltenbeschriftungen Ihres DataFrame enthalten keine doppelten Werte. Wenn dies der Fall ist, können Sie entweder die doppelten Werte entfernen oder sie eindeutig neu kennzeichnen.

Das obige ist der detaillierte Inhalt vonWie behebe ich „ValueError: Neuindizierung von einer doppelten Achse ist nicht möglich“ in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn