>백엔드 개발 >파이썬 튜토리얼 >특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?

특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?

DDD
DDD원래의
2024-12-17 13:03:26844검색

How to Remove Duplicate Rows in Pandas Based on Specific Columns?

Python Pandas의 여러 열을 기반으로 중복 행 제거

Pandas의 drop_duplicates 함수는 DataFrame에서 중복 행을 제거하는 효율적인 방법을 제공합니다. . 그러나 특정 열 집합과 일치하는 경우에만 행을 삭제하려면 어떻게 해야 할까요?

문제:

"A," " B'와 'C'입니다. "A" 열과 "C" 열의 값이 동일한 행을 제거하려고 합니다. 즉, 이 예제 DataFrame에서 0행과 1행을 식별하고 삭제해야 합니다.

A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A

해결책:

이제 다음을 사용하여 이를 쉽게 달성할 수 있습니다. drop_duplicates 함수 및 하위 집합 매개변수:

import pandas as pd

df = pd.DataFrame({"A": ["foo", "foo", "foo", "bar"], "B": [0, 1, 1, 1], "C": ["A", "A", "B", "A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

keep= 매개변수는 중복 삭제 여부를 지정합니다. 행을 포함하거나 제외합니다. False로 설정하면 모든 중복 항목이 삭제됩니다.

결과는 행 0과 1이 제거된 DataFrame이며 "A" 및 "C" 열을 기반으로 하는 고유한 행만 남습니다.

A B C
0 foo 1 B
1 bar 1 A

위 내용은 특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.