>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?

Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-11-04 04:11:30613검색

How to Retrieve Rows with Unique Values in a Pandas DataFrame?

고유한 열 값으로 행 검색: 종합 가이드

많은 프로그래밍 시나리오에서는 특정 열 내의 고유한 값을 기반으로 행을 추출해야 합니다. 이 문서에서는 Python에서 널리 사용되는 Pandas 라이브러리를 사용하여 이 작업을 수행하는 방법을 살펴봅니다.

쿼리:

표시된 것처럼 COL1과 COL2라는 두 개의 열이 있는 데이터세트를 생각해 보세요. 아래:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

목표는 COL2에 고유한 값이 포함된 행만 검색하는 것입니다. 예상되는 출력은 다음과 같습니다.

COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56

해결책:

Pandas의 drop_duplicates 메서드는 하나 이상의 열을 기반으로 중복 행을 제거하는 간단한 방법을 제공합니다. 이 특정 작업에 이를 활용하는 방법은 다음과 같습니다.

<code class="python">import pandas as pd

df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'],
                  'COL2': [22, 45, 34, 45, 56, 22, 45]})

# Keep only the first occurrence of each unique value in COL2
df = df.drop_duplicates('COL2')

print(df)</code>

출력:

  COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

추가 옵션:

drop_duplicates 메소드는 추가 옵션을 제공합니다. 중복 처리를 사용자 정의하는 옵션:

  • keep='last': 각 고유 값의 마지막 발생을 유지합니다.
  • keep=False : 모든 중복 행을 완전히 제거합니다.

다음은 이러한 옵션을 보여주는 예입니다.

<code class="python"># Keep only the last occurrence of each unique value in COL2
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicate rows from the dataset
df = df.drop_duplicates('COL2', keep=False)</code>

위 내용은 Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.