Dataframe 열에서 NaN 값 바꾸기
Pandas에서 DataFrame으로 작업할 때 누락되거나 잘못된 데이터가 NaN 값으로 표시될 수 있습니다. 데이터 품질을 보장하고 오류를 방지하려면 이러한 NaN 값을 적절한 자리 표시자나 대치로 바꿔야 하는 경우가 많습니다.
DataFrame.fillna() 메서드
가장 간단합니다. NaN 값을 바꾸는 방법은 fillna() 메서드를 사용하는 것입니다. 값이나 사전을 인수로 사용하고 지정된 열 또는 전체 DataFrame의 모든 NaN 값을 제공된 값으로 바꿉니다. 값.
예:
import pandas as pd df = pd.DataFrame({ "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489], "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"], "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")] }) df.fillna(0)
출력:
itm Date Amount 0 420 2012-09-30 65211 1 421 2012-09-09 29424 2 421 2012-09-16 29877 3 421 2012-09-23 30990 4 421 2012-09-30 61303 5 485 2012-09-09 71781 6 485 2012-09-16 0.0 7 485 2012-09-23 11072.0 8 485 2012-09-30 113702.0 9 489 2012-09-09 64731 10 489 2012-09-16 0.0
추가 방법:
fillna()는 가장 일반적으로 NaN 값을 바꾸는 데 사용할 수 있는 여러 다른 방법이 있습니다.
결론:
DataFrames에서 NaN 값을 바꾸는 것은 데이터 정리 및 조작에 필수적입니다. 위에 설명된 방법을 활용하면 누락되거나 유효하지 않은 데이터를 효과적으로 처리하여 데이터 분석의 무결성과 품질을 보장할 수 있습니다.
위 내용은 Pandas DataFrames에서 NaN 값을 효과적으로 대체하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!