Pandas 열을 정수로 변환할 때 NaN 값 처리
Pandas 데이터 프레임으로 작업할 때 열을 변환해야 하는 상황이 발생할 수 있습니다. 정수 데이터 유형에 대한 NaN 값을 포함합니다. 그러나 정수 배열은 기본적으로 누락된 값을 처리할 수 없으므로 이 변환은 오류로 이어질 수 있습니다.
오류 처리 접근 방식
'id'를 변환하기 위해 두 가지 접근 방식을 시도했습니다. ' 열을 정수로 변환했지만 둘 다 오류가 발생했습니다.
솔루션: Nullable 정수 데이터 유형
Pandas 버전 0.24에는 Null 허용 정수 데이터 유형 개념이 도입되었습니다. 이 기능을 사용하면 정수 배열에 누락된 값이 포함될 수 있습니다. 이 접근 방식을 사용하려면:
import numpy as np # Create a nullable integer array arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) # Create a Pandas Series from the array series = pd.Series(arr)
결과 시리즈는 'Int64' dtype을 가지며 NaN 값을 허용합니다.
>>> series 0 1 1 2 2 NaN dtype: Int64
Pandas 열 변환
Pandas 열을 null 허용 정수 dtype으로 변환하려면:
df['myCol'] = df['myCol'].astype('Int64')
이렇게 하면 'myCol' 열이 누락된 값이 NaN으로 표시되는 정수 데이터 유형으로 변환됩니다.
위 내용은 Pandas 열을 정수로 변환할 때 NaN 값을 처리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!