>백엔드 개발 >파이썬 튜토리얼 >데이터 준비 시 Python에서 흔히 저지르는 5가지 함정

데이터 준비 시 Python에서 흔히 저지르는 5가지 함정

Joseph Gordon-Levitt
Joseph Gordon-Levitt앞으로
2024-10-29 09:44:15627검색

Python은 데이터 준비를 위한 강력한 언어이지만 몇 가지 사람들이 흔히 겪을 수 있는 실수나 함정. 이번 블로그 포스팅에서는 사람들이 사용할 때 직면하게 되는 가장 일반적인 문제 다섯 가지에 대해 논의합니다. 데이터 준비를 위한 Python

데이터 준비 시 Python에서 흔히 저지르는 5가지 함정

1. 누락된 값(`NaN`)을 false로 간주합니다.

False, None 및 0(모든 숫자 유형)은 모두 False로 평가됩니다.

이 개체 및 값 집합은 "거짓"으로 알려져 있으며 거짓으로 평가합니다. NaN 또는 누락된 값은 거짓이 아니므로 false로 평가되지 않습니다. 이는 많은 작업으로 인해 많은 혼란과 예상치 못한 동작이 발생할 수 있습니다.

2. 결측값 비교 시도

NaN == NaN이 true를 반환할 정도로 간단해 보입니다. 두 값 모두 "같아 보입니다".

그러나 누락된 두 값이 같은지 알 수 없으므로 이 연산은 항상 false를 반환합니다.

3. all()은 모든 요소가 true인 경우에만 true를 반환한다고 생각합니다.

all() 메서드는 iterable의 모든 요소가 true인 경우(또는 다음과 같은 경우) true를 반환합니다. 반복 가능한 항목은 비어 있습니다). 

"모든 요소가 true이면 true를 반환한다"고 생각하지 마세요. iterable은 true입니다.” 대신 “false가 없으면 true를 반환합니다.

iterable이 비어 있으면 그 안에 false 요소가 있을 수 없습니다. 즉, all([])이 True로 평가됩니다.

4. 부울 값으로 변환

Pandas는 다음과 같은 경우 오류를 발생시키는 numpy 규칙을 따릅니다. 무언가를 bool로 변환해 보십시오. 이는 if 또는 사용할 때 발생합니다. 부울 연산, and, or 또는 not.

결과가 무엇인지 명확하지 않습니다. 그것이 사실이어야 하는가? 길이가 0이 아니기 때문에? False 값이 있어서 False인가요?

불명확하므로 대신 Pandas에서 ValueError가 발생합니다

ValueError: 시리즈의 진리값이 모호합니다. 

a.empty, a.bool() a.item(),a.any() 또는 a.all()을 사용하세요.

5. isin() 연산의 결과를 이해합니다.

isin() 연산은 다음을 나타내는 부울 계열을 반환합니다. 시리즈의 각 요소가 전달된 요소에 정확하게 포함되어 있는지 여부 값의 순서입니다.

 s = pd.Series(['dog', 'cat', 'fish'])
>>> s.isin(['bird'])
0    False
1    False
2    False
dtype: bool

참고로 '새'는 시리즈에 존재하지 않습니다.

>>> s.isin(['bird', 'cat'])
0    False
1     True
2    False
dtype: bool

참고로 '고양이'는 시리즈의 2번째 값에 존재합니다.

데이터 준비를 위한 Python 사용에 대해 자세히 알아보기

Python은 강력한 언어이지만 혼란을 초래할 수 있습니다. 주변에서 일어나다 누락된 값과 부울 값. 누락된 값은 다음과 같습니다. 거짓으로 간주되어 비교할 수 없습니다. 

all() 메서드를 사용할 때 반환된다는 점을 기억하세요. iterable에 false 값이 없으면 true입니다.  모든 값이 다음과 같은 경우 누락된 값은 빈 배열의 경우처럼 누락된 값이 거짓으로 간주되지 않으므로 all()도 true를 반환합니다. 

부울 값으로 변환하려고 할 때 ValueError가 발생하는 경우 유용한 조언을 받아들이고 제안된 방법 중 하나를 사용하세요.

위 내용은 데이터 준비 시 Python에서 흔히 저지르는 5가지 함정의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 pluralsight.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제