>  기사  >  백엔드 개발  >  팬더에서 중복을 제거하는 방법은 무엇입니까?

팬더에서 중복을 제거하는 방법은 무엇입니까?

百草
百草원래의
2023-11-22 11:55:173700검색

Pandas 중복 제거 방법은 다음과 같습니다. 1. drop_duplicates() 메서드를 사용합니다. 2. Duplicate() 메서드를 사용합니다. 4. value_counts() 메서드를 사용합니다. 자세한 소개: 1. drop_duplicates() 메서드를 사용하여 데이터 프레임에서 중복 행을 삭제하고 새 데이터 프레임을 반환합니다. 중복 제거 후 중복 제거 및 보존 순서 지정과 같은 중복 제거 수행 방법을 제어하는 ​​매개변수를 설정할 수 있습니다. 열 등.

팬더에서 중복을 제거하는 방법은 무엇입니까?

이 튜토리얼의 운영 체제: Windows 10 시스템, DELL G3 컴퓨터.

Pandas는 다양한 중복 제거 방법을 제공하는 강력한 Python 데이터 분석 라이브러리입니다. 다음은 Pandas를 사용하여 중복 제거 작업을 위한 일반적인 방법입니다.

1. drop_duplicates() 메서드를 사용하세요.

drop_duplicates() 메서드는 데이터 프레임에서 중복 행을 삭제하고 새 데이터 프레임을 반환하는 데 사용됩니다. 중복 제거 후 보존 순서 지정, 중복 제거 중 비교 열 지정 등 중복 제거 수행 방법을 제어하는 ​​매개변수를 설정할 수 있습니다.

샘플 코드:

import pandas as pd  
  
df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]})  
df_unique = df.drop_duplicates()  # 默认情况下,按行进行去重,返回新的数据框

2.duplicate() 메서드 사용

duplicate() 메서드는 데이터 프레임에서 중복 행을 찾아 부울 계열을 반환하는 데 사용됩니다. 중복 제거 후 보존 순서 지정, 중복 제거 중 비교 열 지정 등 중복 제거 수행 방법을 제어하는 ​​매개변수를 설정할 수 있습니다.

샘플 코드:

import pandas as pd  
  
df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]})  
df_unique = df[~df.duplicated()]  # 使用duplicated()方法查找重复的行,并使用逻辑非运算符返回不重复的行

3. Unique() 메서드 사용

unique() 메서드는 데이터 프레임의 모든 고유 값을 반환하고 목록 또는 Series 객체를 반환하는 데 사용됩니다. 단일 또는 여러 열의 중복을 제거하는 데 사용할 수 있습니다.

샘플 코드:

import pandas as pd  
  
df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]})  
df_unique = df.apply(lambda x: pd.Series(x.unique()))  # 使用apply()方法对每一列进行去重,并返回一个Series对象

4. value_counts() 메서드 사용

value_counts() 메서드는 데이터 프레임에서 각 값의 발생 횟수를 계산하고 Series 개체를 반환하는 데 사용됩니다. 단일 또는 여러 열의 중복을 제거하는 데 사용할 수 있습니다.

샘플 코드:

import pandas as pd  
  
df = pd.DataFrame({'A': [1, 2, 1, 2, 3], 'B': [4, 5, 6, 7, 8]})  
df_unique = df.groupby(df.columns.tolist()).size().reset_index(name='counts')  # 对整个数据框进行分组计数,并返回一个Series对象,然后使用reset_index()方法转换为数据框格式,方便查看每个值的出现次数

위 내용은 팬더에서 중복을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.