>  기사  >  백엔드 개발  >  B열에서 가장 높은 값을 가진 행을 유지하면서 A열의 중복 항목을 제거하는 방법은 무엇입니까?

B열에서 가장 높은 값을 가진 행을 유지하면서 A열의 중복 항목을 제거하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-11-08 09:46:02903검색

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

A열에서 중복 항목을 제거할 때 B 값이 가장 높은 행 유지

현재 작업에는 A열의 중복 값을 제거하는 작업이 포함됩니다. B 열에서 가장 높은 값을 가진 행을 유지하면서 데이터 프레임을 만듭니다. 이를 달성하기 위해 Python의 Pandas 라이브러리에 내장된 함수를 활용할 수 있습니다.

한 가지 접근 방식은 데이터 프레임을 A 열로 정렬한 다음 중복 항목을 삭제하는 것입니다. 마지막 발생을 유지하면서. 이는 다음과 같이 표현됩니다.

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')

또는 다양한 기준을 고려할 수 있는 보다 유연한 솔루션은 데이터 프레임을 A 열로 그룹화하는 것입니다. 각 그룹 내에서 B 열의 최대값이 있는 행은 다음과 같습니다. 추출되었습니다. 이는 다음 코드를 사용하여 달성할 수 있습니다.

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])

이러한 방법 중 하나를 구현하면 B 값이 가장 높은 행이 보존되도록 하면서 A 열에서 중복 값을 효과적으로 제거할 수 있습니다.

위 내용은 B열에서 가장 높은 값을 가진 행을 유지하면서 A열의 중복 항목을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.