DataFrame에서 고유한 행 값 검색
이 상황에서는 특정 행의 고유한 값을 기반으로 DataFrame에서 행을 추출하는 것을 목표로 합니다. 열을 COL2로 표시하겠습니다.
이 작업을 수행하기 위해 drop_duplicates 함수를 도입합니다. 중복 값을 확인하려는 열을 지정하여 중복 행을 제거할 수 있습니다.
첫 번째 항목 보존:
예를 들어, 각각의 개별 COL2 값이 처음 나타나는 경우 다음을 활용할 수 있습니다.
<code class="python">df = df.drop_duplicates('COL2')</code>
또는 다음과 같이 작성할 수 있습니다.
<code class="python">df = df.drop_duplicates('COL2', keep='first')</code>
이렇게 하면 각각의 첫 번째 행이 유지됩니다. COL2의 고유 값.
마지막 발생 유지:
대신 고유 값의 마지막 발생을 보존하려면 keep 매개변수를 'last'로 수정합니다.
<code class="python">df = df.drop_duplicates('COL2', keep='last')</code>
모든 중복 항목 제거:
COL2에서 동일한 값을 가진 행을 포함하여 모든 중복 행을 제거하려면 keep을 False로 설정합니다.
<code class="python">df = df.drop_duplicates('COL2', keep=False)</code>
이러한 기술을 따르면 지정된 열의 고유한 값을 기반으로 중복 행을 효율적으로 제거하여 DataFrame에 고유한 데이터만 포함되도록 할 수 있습니다.
위 내용은 Pandas의 DataFrame에서 고유한 행 값을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!