>백엔드 개발 >파이썬 튜토리얼 >그룹화된 데이터 작업에 Pandas 적용과 변환을 언제 사용해야 합니까?

그룹화된 데이터 작업에 Pandas 적용과 변환을 언제 사용해야 합니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-11 08:02:02867검색

When to Use Pandas apply vs transform for Grouped Data Operations?

Pandas에서는 적용과 변환을 모두 사용하여 그룹화된 데이터에 대한 작업을 수행할 수 있습니다. 그러나 두 방법에는 몇 가지 중요한 차이점이 있습니다.

입력 유형

  • apply는 각 그룹의 전체 DataFrame을 사용자 지정 함수에 대한 입력으로 전달합니다.
  • transform은 각 그룹에 대한 DataFrame의 각 열을 개별적으로 사용자 정의 함수에 대한 입력으로 전달합니다.

출력 유형

  • Apply는 스칼라, 시리즈 또는 DataFrame을 반환할 수 있습니다.
  • 변환은 그룹과 길이가 동일한 시퀀스(예: 시리즈, 배열 또는 목록)를 반환해야 합니다.

변환

  • apply는 값 집계, 행 필터링, 데이터 수정 등 DataFrame에서 변환을 수행하는 데 사용할 수 있습니다.
  • transform은 주로 다음을 수행하는 데 사용됩니다. 값 크기 조정 또는 새 열 추가와 같은 그룹 내 행별 작업

다음 DataFrame을 고려하세요.

적용을 사용하여 각 그룹 내 D열에서 C열을 빼려면:

변환을 사용하여 각 그룹 내 D열에서 C열을 빼려면:

변환에 전달된 람다 함수는 C와 D의 차이 평균을 반환하여 원래 DataFrame과 동일한 모양의 변환된 열이 생성됩니다.

적용 및 변환 사용 시기:

  • 그룹 내의 여러 열에 액세스해야 하거나 출력의 모양이 다른 작업(예: 값 집계 또는 행 필터링)을 수행해야 하는 경우 적용을 사용하세요.
  • 변환을 사용하는 경우는 다음과 같습니다. 그룹 내에서 행 단위 작업을 수행해야 하고 입력 데이터와 동일한 형태의 새 열이나 변수를 생성하려는 경우.

위 내용은 그룹화된 데이터 작업에 Pandas 적용과 변환을 언제 사용해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.