>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrames에서 누락된 값을 효율적으로 채우는 방법은 무엇입니까?

Pandas DataFrames에서 누락된 값을 효율적으로 채우는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-11 10:30:03736검색

How to Efficiently Fill Missing Values in Pandas DataFrames?

DataFrames에서 누락된 값 채우기: 효율적인 접근 방식

Pandas에서는 불완전한 데이터세트로 작업할 때 누락된 값을 채워야 하는 경우가 많습니다. 각 행을 반복하는 것은 비효율적이지만 fillna는 열 전체에서 누락된 값을 채울 수 있는 편리한 솔루션을 제공합니다.

"Cat1" 열에 누락된 값이 있는 다음 DataFrame을 고려하세요.

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    NaN   ant

"Cat2"의 값을 사용하여 네 번째 행에 대한 "Cat1"의 결측값을 채우면 다음과 같이 fillna 방법을 활용할 수 있습니다.

df['Cat1'].fillna(df['Cat2'])

이 접근 방식은 결측값 채우기를 위한 빠르고 메모리 효율적인 솔루션을 제공합니다. 대규모 데이터 세트의 값. fillna 메서드는 다른 열을 인수로 사용하고 일치하는 인덱스를 사용하여 누락된 값을 대체합니다.

결과:

        Day  Cat1  Cat2
0         1    cat   mouse
1         2    dog   elephant
2         3    cat   giraf
3         4    ant   ant

이 효율적인 방법을 활용하여 Pandas에서 누락된 값을 채움으로써 개발자는 다음을 수행할 수 있습니다. 데이터 무결성을 보장하고 데이터 분석의 정확성을 높입니다.

위 내용은 Pandas DataFrames에서 누락된 값을 효율적으로 채우는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.