>백엔드 개발 >파이썬 튜토리얼 >Pandas의 누락된 값을 그룹 평균으로 채우는 방법은 무엇입니까?

Pandas의 누락된 값을 그룹 평균으로 채우는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-11 12:58:11480검색

How to Fill Missing Values in Pandas with the Group Mean?

Pandas의 각 그룹에서 평균으로 누락된 값 채우기

이 맥락에서 목표는 누락된 값("NaN")을 채우는 것입니다. )를 "이름" 열 내의 각 개별 그룹에 대한 평균값으로 바꿉니다. 이를 달성하기 위해 fillna 메소드와 함께 Pandas의 변환 기능을 활용할 수 있습니다.

제공된 DataFrame 예제를 고려해 보겠습니다.

각 "이름" 내의 평균값을 계산하려면 group의 경우 groupby 함수를 사용할 수 있습니다.

그러나 grouped는 평균값을 포함하는 DataFrame이므로 다음을 수행해야 합니다. 이를 원래 DataFrame에 다시 적용하여 누락된 값을 채웁니다. 변환이 유용해지는 곳은 다음과 같습니다.

코드 분석은 다음과 같습니다.

  • df.groupby("name")는 DataFrame을 "이름" 열로 그룹화합니다.
  • lambda x: x.fillna(x.mean())은 각 그룹을 취하는 익명 함수를 정의합니다. (x로 표시)를 입력으로 사용하고 다음 작업을 수행합니다.

    • x.mean()을 사용하여 계산된 평균값으로 누락된 값("NaN")을 채웁니다.
  • df["value"]는 원본 DataFrame의 "value" 열을 누락된 부분을 채우는 변환된 값으로 바꿉니다. 값.

코드를 실행한 후 결과 DataFrame에는 원하는 대로 채워진 값이 포함됩니다.

위 내용은 Pandas의 누락된 값을 그룹 평균으로 채우는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.