>백엔드 개발 >파이썬 튜토리얼 >데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?

데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-11-04 10:41:30612검색

How to Extract Rows Based on Distinct Values in a Dataframe Column?

데이터 프레임 열에서 고유 값 쿼리

데이터 프레임으로 작업할 때 데이터 프레임의 고유 값을 기반으로 행을 검색해야 하는 경우가 종종 있습니다. 특정 열. 이를 통해 중복 값을 제거하고 고유한 데이터 포인트 세트를 얻을 수 있습니다.

다음 데이터프레임을 고려하세요.

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

열의 고유 값에 해당하는 행을 추출한다고 가정합니다. COL2. 이를 달성하기 위해 pandas의 drop_duplicates 기능을 활용할 수 있습니다. 이 함수는 열 이름을 인수로 사용하고 데이터 프레임에서 중복 행을 제거합니다.

<code class="python">import pandas as pd

df = pd.DataFrame(...)  # assuming the given dataframe
df = df.drop_duplicates('COL2')</code>

기본적으로 drop_duplicates는 각 고유 값의 첫 번째 항목을 유지합니다. 또는 keep='last'를 지정하여 마지막 항목을 유지하거나 keep=False를 지정하여 모든 중복 행을 제거할 수 있습니다.

<code class="python"># Keep first occurrence
df = df.drop_duplicates('COL2', keep='first')

# Keep last occurrence
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicates
df = df.drop_duplicates('COL2', keep=False')</code>

위 명령 중 하나를 실행한 후 데이터 프레임 df에는 해당 행만 포함됩니다. COL2 열의 고유 값에 해당:

    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

위 내용은 데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.