>  기사  >  백엔드 개발  >  Python은 다중 속성 중복 데이터를 중복 제거합니다.

Python은 다중 속성 중복 데이터를 중복 제거합니다.

不言
不言원래의
2018-04-18 15:29:532327검색

다음은 다중 속성 중복 데이터를 중복 제거하는 Python 예제입니다. 좋은 참조 값이 있으며 모든 사람에게 도움이 되기를 바랍니다. 함께 살펴보겠습니다

Pandas 모듈에서 중복 데이터를 제거하는 Python 단계:

1) DataFrame의 Duplicate 메서드를 사용하여 부울 시리즈를 반환하여 각 행에 중복 행이 있는지 표시합니다. 중복된 행은 FALSE로 표시되고 중복된 행은 TRUE로 표시됩니다.

2) DataFrame의 drop_duplicates 메서드를 사용하여 중복 행이 제거된 DataFrame을 반환합니다.

참고:

duplicated 메소드와 drop_duplicates 메소드에 매개변수가 설정되지 않은 경우 이 두 메소드는 지정된 속성 이름(또는 열)이 이 두 메소드 이름에 추가되면 기본적으로 모두 판단됩니다. 예를 들어,frame.drop_duplicates(['state']) 그런 다음 열의 일부(상태 열)를 지정하여 중복을 확인합니다.

구체적인 예는 다음과 같습니다.

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>


위 내용은 Python은 다중 속성 중복 데이터를 중복 제거합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.