Pandas에서는 적용과 변환을 모두 사용하여 그룹화된 데이터에 대한 작업을 수행할 수 있습니다. 그러나 두 방법에는 몇 가지 중요한 차이점이 있습니다.
입력 유형
- apply는 각 그룹의 전체 DataFrame을 사용자 지정 함수에 대한 입력으로 전달합니다.
- transform은 각 그룹에 대한 DataFrame의 각 열을 개별적으로 사용자 정의 함수에 대한 입력으로 전달합니다.
출력 유형
- Apply는 스칼라, 시리즈 또는 DataFrame을 반환할 수 있습니다.
- 변환은 그룹과 길이가 동일한 시퀀스(예: 시리즈, 배열 또는 목록)를 반환해야 합니다.
변환
- apply는 값 집계, 행 필터링, 데이터 수정 등 DataFrame에서 변환을 수행하는 데 사용할 수 있습니다.
- transform은 주로 다음을 수행하는 데 사용됩니다. 값 크기 조정 또는 새 열 추가와 같은 그룹 내 행별 작업
예
다음 DataFrame을 고려하세요.
적용을 사용하여 각 그룹 내 D열에서 C열을 빼려면:
변환을 사용하여 각 그룹 내 D열에서 C열을 빼려면:
변환에 전달된 람다 함수는 C와 D의 차이 평균을 반환하여 원래 DataFrame과 동일한 모양의 변환된 열이 생성됩니다.
적용 및 변환 사용 시기:
- 그룹 내의 여러 열에 액세스해야 하거나 출력의 모양이 다른 작업(예: 값 집계 또는 행 필터링)을 수행해야 하는 경우 적용을 사용하세요.
- 변환을 사용하는 경우는 다음과 같습니다. 그룹 내에서 행 단위 작업을 수행해야 하고 입력 데이터와 동일한 형태의 새 열이나 변수를 생성하려는 경우.
위 내용은 그룹화된 데이터 작업에 Pandas 적용과 변환을 언제 사용해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!