>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrames에서 NaN 값을 효과적으로 대체하려면 어떻게 해야 합니까?

Pandas DataFrames에서 NaN 값을 효과적으로 대체하려면 어떻게 해야 합니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-03 20:16:10269검색

How can I effectively replace NaN values in Pandas DataFrames?

Dataframe 열에서 NaN 값 바꾸기

Pandas에서 DataFrame으로 작업할 때 누락되거나 잘못된 데이터가 NaN 값으로 표시될 수 있습니다. 데이터 품질을 보장하고 오류를 방지하려면 이러한 NaN 값을 적절한 자리 표시자나 대치로 바꿔야 하는 경우가 많습니다.

DataFrame.fillna() 메서드

가장 간단합니다. NaN 값을 바꾸는 방법은 fillna() 메서드를 사용하는 것입니다. 값이나 사전을 인수로 사용하고 지정된 열 또는 전체 DataFrame의 모든 NaN 값을 제공된 값으로 바꿉니다. 값.

예:

import pandas as pd

df = pd.DataFrame({
    "itm": [420, 421, 421, 421, 421, 485, 485, 485, 485, 489, 489],
    "Date": ["2012-09-30", "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", 
             "2012-09-09", "2012-09-16", "2012-09-23", "2012-09-30", "2012-09-09", "2012-09-16"],
    "Amount": [65211, 29424, 29877, 30990, 61303, 71781, float("NaN"), 11072, 113702, 64731, float("NaN")]
})

df.fillna(0)

출력:

       itm       Date    Amount
0     420  2012-09-30    65211
1     421  2012-09-09    29424
2     421  2012-09-16    29877
3     421  2012-09-23    30990
4     421  2012-09-30    61303
5     485  2012-09-09    71781
6     485  2012-09-16      0.0
7     485  2012-09-23   11072.0
8     485  2012-09-30  113702.0
9     489  2012-09-09    64731
10    489  2012-09-16      0.0

추가 방법:

fillna()는 가장 일반적으로 NaN 값을 바꾸는 데 사용할 수 있는 여러 다른 방법이 있습니다.

  • .replace(): 이 방법은 NaN 값을 특정 값으로 바꾸는 데 사용할 수 있습니다. 값 또는 마스크.
  • .interpolate(): 이 방법은 다양한 보간 기술을 사용하여 누락된 항목을 추정합니다. 값.
  • .pivot_table(): 이 방법을 사용하면 누락된 값을 무시하고 데이터를 그룹화하고 집계할 수 있습니다.

결론:

DataFrames에서 NaN 값을 바꾸는 것은 데이터 정리 및 조작에 필수적입니다. 위에 설명된 방법을 활용하면 누락되거나 유효하지 않은 데이터를 효과적으로 처리하여 데이터 분석의 무결성과 품질을 보장할 수 있습니다.

위 내용은 Pandas DataFrames에서 NaN 값을 효과적으로 대체하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.