집 >백엔드 개발 >파이썬 튜토리얼 >특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?

특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?

DDD원래의: 2024-12-17 13:03:26941검색

How to Remove Duplicate Rows in Pandas Based on Specific Columns?

Python Pandas의 여러 열을 기반으로 중복 행 제거

Pandas의 drop_duplicates 함수는 DataFrame에서 중복 행을 제거하는 효율적인 방법을 제공합니다. . 그러나 특정 열 집합과 일치하는 경우에만 행을 삭제하려면 어떻게 해야 할까요?

문제:

"A," " B'와 'C'입니다. "A" 열과 "C" 열의 값이 동일한 행을 제거하려고 합니다. 즉, 이 예제 DataFrame에서 0행과 1행을 식별하고 삭제해야 합니다.

	A	B	C
0	foo	0	A
1	foo	1	A
2	foo	1	B
3	bar	1	A

해결책:

이제 다음을 사용하여 이를 쉽게 달성할 수 있습니다. drop_duplicates 함수 및 하위 집합 매개변수:

import pandas as pd

df = pd.DataFrame({"A": ["foo", "foo", "foo", "bar"], "B": [0, 1, 1, 1], "C": ["A", "A", "B", "A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

keep= 매개변수는 중복 삭제 여부를 지정합니다. 행을 포함하거나 제외합니다. False로 설정하면 모든 중복 항목이 삭제됩니다.

결과는 행 0과 1이 제거된 DataFrame이며 "A" 및 "C" 열을 기반으로 하는 고유한 행만 남습니다.

	A	B	C
0	foo	1	B
1	bar	1	A

위 내용은 특정 열을 기반으로 Pandas에서 중복 행을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python pandas if using function this Other

성명：

이전 기사：목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?다음 기사：목록의 Pandas 열을 여러 열로 효율적으로 분할하는 방법은 무엇입니까?