데이터 프레임 열에서 고유 값 쿼리
데이터 프레임으로 작업할 때 데이터 프레임의 고유 값을 기반으로 행을 검색해야 하는 경우가 종종 있습니다. 특정 열. 이를 통해 중복 값을 제거하고 고유한 데이터 포인트 세트를 얻을 수 있습니다.
다음 데이터프레임을 고려하세요.
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
열의 고유 값에 해당하는 행을 추출한다고 가정합니다. COL2. 이를 달성하기 위해 pandas의 drop_duplicates 기능을 활용할 수 있습니다. 이 함수는 열 이름을 인수로 사용하고 데이터 프레임에서 중복 행을 제거합니다.
<code class="python">import pandas as pd df = pd.DataFrame(...) # assuming the given dataframe df = df.drop_duplicates('COL2')</code>
기본적으로 drop_duplicates는 각 고유 값의 첫 번째 항목을 유지합니다. 또는 keep='last'를 지정하여 마지막 항목을 유지하거나 keep=False를 지정하여 모든 중복 행을 제거할 수 있습니다.
<code class="python"># Keep first occurrence df = df.drop_duplicates('COL2', keep='first') # Keep last occurrence df = df.drop_duplicates('COL2', keep='last') # Remove all duplicates df = df.drop_duplicates('COL2', keep=False')</code>
위 명령 중 하나를 실행한 후 데이터 프레임 df에는 해당 행만 포함됩니다. COL2 열의 고유 값에 해당:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
위 내용은 데이터 프레임 열의 고유 값을 기반으로 행을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!