집 >백엔드 개발 >파이썬 튜토리얼 >Pandas의 DataFrame에서 고유한 행 값을 검색하는 방법은 무엇입니까?

Pandas의 DataFrame에서 고유한 행 값을 검색하는 방법은 무엇입니까?

How to Retrieve Distinct Row Values from a DataFrame in Pandas?

DataFrame에서 고유한 행 값 검색

이 상황에서는 특정 행의 고유한 값을 기반으로 DataFrame에서 행을 추출하는 것을 목표로 합니다. 열을 COL2로 표시하겠습니다.

이 작업을 수행하기 위해 drop_duplicates 함수를 도입합니다. 중복 값을 확인하려는 열을 지정하여 중복 행을 제거할 수 있습니다.

첫 번째 항목 보존:

예를 들어, 각각의 개별 COL2 값이 처음 나타나는 경우 다음을 활용할 수 있습니다.

<code class="python">df = df.drop_duplicates('COL2')</code>

또는 다음과 같이 작성할 수 있습니다.

<code class="python">df = df.drop_duplicates('COL2', keep='first')</code>

이렇게 하면 각각의 첫 번째 행이 유지됩니다. COL2의 고유 값.

마지막 발생 유지:

대신 고유 값의 마지막 발생을 보존하려면 keep 매개변수를 'last'로 수정합니다.

<code class="python">df = df.drop_duplicates('COL2', keep='last')</code>

모든 중복 항목 제거:

COL2에서 동일한 값을 가진 행을 포함하여 모든 중복 행을 제거하려면 keep을 False로 설정합니다.

<code class="python">df = df.drop_duplicates('COL2', keep=False)</code>

이러한 기술을 따르면 지정된 열의 고유한 값을 기반으로 중복 행을 효율적으로 제거하여 DataFrame에 고유한 데이터만 포함되도록 할 수 있습니다.

위 내용은 Pandas의 DataFrame에서 고유한 행 값을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：