>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame의 여러 열에 함수를 적용하는 방법은 무엇입니까?

Pandas DataFrame의 여러 열에 함수를 적용하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-12-08 15:16:12531검색

How to Apply a Function to Multiple Columns in a Pandas DataFrame?

Pandas 데이터 프레임의 여러 열에 함수 적용

Pandas 데이터 프레임에 여러 열이 있는 데이터 세트가 있고 다음을 수행하고 싶다고 가정해 보겠습니다. 해당 열 중 두 개에 사용자 정의 함수를 적용합니다. 이는 데이터 조작 및 분석에서 일반적인 작업일 수 있습니다. 이를 달성하기 위한 단계별 가이드는 다음과 같습니다.

1. 함수 정의:

두 열의 값을 나타내는 두 입력을 사용하는 사용자 정의 함수를 정의합니다. 이 기능은 이러한 입력에서 원하는 작업을 수행해야 합니다.

2. Lambda를 사용하여 함수 적용:

Pandas는 데이터 프레임의 각 행에 함수를 적용할 수 있는 람다 함수를 제공합니다. 이를 활용하여 선택한 열에 사용자 정의 함수를 적용할 수 있습니다.

람다를 사용하여 여러 열에 함수를 적용하는 구문은 다음과 같습니다.

df['new_column_name'] = df.apply(lambda x: your_function(x.column_1, x.column_2), axis=1)

위치:

  • new_column_name은 함수 결과를 저장할 새 열의 이름입니다.
  • your_function은 두 개의 입력을 받아 원하는 출력을 반환하는 사용자 정의 함수.
  • x는 데이터프레임의 각 행을 나타내고 x.column_1 및 x.column_2는 지정된 열의 값에 액세스합니다.
  • axis=1은 각 열이 아닌 각 행에 함수가 적용됨을 나타냅니다.

3. 예:

다음 예제 데이터 프레임을 고려하십시오.

df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]})

값을 기반으로 원본 목록 mylist의 하위 목록을 포함하는 'col_3'이라는 새 열을 생성한다고 가정합니다. col_1과 col_2에 있습니다. 다음과 같이 get_sublist 함수를 정의할 수 있습니다.

def get_sublist(sta, end):
    return ['a', 'b', 'c', 'd', 'e', 'f'][sta:end+1]

이제 람다를 사용하여 이 함수를 다음과 같이 적용할 수 있습니다.

df['col_3'] = df.apply(lambda x: get_sublist(x.col_1, x.col_2), axis=1)

이렇게 하면 데이터 프레임에 다음과 같은 새 열 'col_3'이 생성됩니다. 원하는 하위 목록

4. 대안:

람다를 사용하는 것은 여러 데이터 프레임 열에 함수를 적용하기 위한 간결하고 다양한 접근 방식입니다. 그러나 보다 명시적인 방법을 선호하는 경우 Series를 입력으로 사용하는 사용자 정의 함수와 함께 apply() 메서드를 사용할 수도 있습니다. 이 접근 방식에는 행을 나타내는 단일 입력을 사용하고 필요에 따라 해당 특정 행을 조작하는 함수 정의가 포함됩니다.

위 내용은 Pandas DataFrame의 여러 열에 함수를 적용하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.