「ValueError: 重複した軸からインデックスを再作成できません」を理解する
Pandas では、インデックスの再作成とは、行または列のラベルを変更する操作を指しますデータフレームの。再インデックス操作が試行され、重複した軸が発生すると、「ValueError: 重複した軸からインデックスを再作成できません」エラーが発生します。
説明
このエラーは通常、この問題は、インデックス (行ラベル) または列 (列ラベル) に重複する値が含まれる DataFrame に新しい行または列を割り当てるときに発生します。
質問のコンテキストでは、「sums」という名前の新しい行を割り当てています。 ' affinity_matrix データフレームに追加します。ただし、このエラーは、affinity_matrix の列に重複した値が含まれている可能性があることを示唆しています。これが問題の原因である可能性があります。
例
文字列ラベルの行と整数ラベルの列を持つ次の DataFrame を考えてみましょう:
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], index=["a", "b", "c"], columns=[1, 2, 2])
このデータフレームでは、列 2 が 2 回表示されます。各列の値を合計して「sum」という名前の新しい行を割り当てようとすると、同じエラーが発生します。
df.loc['sum'] = df.sum(axis=0)
ValueError: cannot reindex from a duplicate axis
このエラーは、DataFrame にすでにラベル付けされた列があるために発生します。 '2' であり、そこからインデックスを再作成しようとすると、あいまいな割り当てが作成されます。
問題の解決
この問題を解決するには、インデックスまたはDataFrame の列ラベルには重複した値が含まれていません。存在する場合は、重複した値を削除するか、それらに一意にラベルを付け直すことができます。
以上がPandas で「ValueError: 重複した軸からインデックスを再作成できません」を解決する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。