"ValueError: 중복 축에서 다시 색인을 생성할 수 없음" 이해
Python의 Pandas 라이브러리에서 이 오류 메시지는 작업을 수행할 수 없음을 나타냅니다. 데이터 구조에 참조되는 축에 중복된 값이 포함되어 있기 때문입니다.
오류 원인
구체적으로 DataFrame 또는 Series를 할당하여 Reindex하려고 하면 오류가 발생합니다. 이미 존재하는 인덱스를 사용하는 새 행 또는 열. 재인덱싱에는 인덱스 레이블 변경이 포함되며, 중복 레이블이 있는 경우 작업을 해당 데이터에 고유하게 매핑하는 것이 불가능해집니다.
예시 시나리오
이를 설명하려면 오류가 발생하면 열 이름이 중복된 Pandas DataFrame을 고려해 보세요. 다음은 이것이 어떻게 발생할 수 있는지 보여주는 Python 스니펫입니다.
<code class="python">import pandas as pd df = pd.DataFrame({ "ID": [1, 2, 3], "Name": ["Alice", "Bob", "Charlie"], "Score": [90, 80, 70], "Age": [25, 26, 27] }) df["Score"] = df["Score"] * 2 df["Age"] = df["Age"] + 1 # Attempt to create a duplicate column df["Score"] = df["Score"] * 1.1</code>
이 스니펫을 실행하면 다음 오류가 발생합니다.
ValueError: cannot reindex from a duplicate axis
이는 DataFrame이 이미 "Score"라는 열이 있고 동일한 이름을 사용하여 해당 열에 새 값을 할당하려고 합니다. 중복된 열로 인해 Pandas가 열을 성공적으로 다시 색인화할 수 없습니다.
해결 방법
이 오류를 해결하려면 다시 색인화하는 데 사용되는 색인 값이 고유한지 확인해야 합니다. 기존 행이나 열에 할당하는 경우 중복 레이블을 피하는 것을 의미합니다. 의도하지 않게 중복된 값이 유입된 경우, .duplicated() 메소드를 사용하여 인덱스를 확인하고 그에 따라 중복된 값을 제거할 수 있습니다.
위 내용은 Pandas 오류 \'ValueError: 중복 축에서 다시 색인을 생성할 수 없습니다\'의 원인은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!