>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame에서 NaN 값을 효율적으로 대체하려면 어떻게 해야 합니까?

Pandas DataFrame에서 NaN 값을 효율적으로 대체하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-30 20:38:13152검색

How Can I Efficiently Replace NaN Values in a Pandas DataFrame?

Pandas DataFrame에서 NaN을 효율적으로 교체

데이터 분석에서 null 값이나 NaN은 문제를 일으킬 수 있습니다. 예를 들어 NaN이 포함된 pandas DataFrame을 고려해 보겠습니다.

import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])

이러한 NaN을 효과적으로 처리하기 위해 NaN을 논리 값으로 바꾸는 우아한 솔루션을 찾습니다.

정방향 채우기 접근 방식

효율적이고 루프가 없는 방법 중 하나는 ffill과 함께 fillna 방법을 활용하는 것입니다. 매개변수. 이 작업은 마지막으로 관찰된 값을 앞으로 전파하여 후속 NaN을 대체합니다. 지정된 DataFrame의 경우 다음과 같은 결과가 발생합니다.

df.fillna(method='ffill')
   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

역방향 채우기 접근 방식

또는 NaN을 동일한 열의 가장 가까운 값으로 바꾸지만 역방향을 원할 경우 bfill 매개변수를 사용할 수 있습니다. 이 메서드는 처음 관찰된 값을 뒤로 전파하여 NaN을 채웁니다.

내부 수정

기본적으로 fillna 메서드는 원본 DataFrame을 수정하지 않습니다. 변경 사항을 영구적으로 적용하려면 inplace=True를 사용하세요.

df.fillna(method='ffill', inplace=True)

이 작업은 df를 직접 업데이트하여 지정된 방법에 따라 모든 NaN을 바꿉니다.

결론

fillna 방법의 유연성을 활용하여 Pandas DataFrames의 NaN을 순방향 및 역방향 채우기 기술을 사용하여 분석을 위한 깨끗하고 완전한 데이터를 보장합니다.

위 내용은 Pandas DataFrame에서 NaN 값을 효율적으로 대체하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.