Pandas 데이터 프레임의 여러 열에 함수 적용
Pandas 데이터 프레임에 여러 열이 있는 데이터 세트가 있고 다음을 수행하고 싶다고 가정해 보겠습니다. 해당 열 중 두 개에 사용자 정의 함수를 적용합니다. 이는 데이터 조작 및 분석에서 일반적인 작업일 수 있습니다. 이를 달성하기 위한 단계별 가이드는 다음과 같습니다.
1. 함수 정의:
두 열의 값을 나타내는 두 입력을 사용하는 사용자 정의 함수를 정의합니다. 이 기능은 이러한 입력에서 원하는 작업을 수행해야 합니다.
2. Lambda를 사용하여 함수 적용:
Pandas는 데이터 프레임의 각 행에 함수를 적용할 수 있는 람다 함수를 제공합니다. 이를 활용하여 선택한 열에 사용자 정의 함수를 적용할 수 있습니다.
람다를 사용하여 여러 열에 함수를 적용하는 구문은 다음과 같습니다.
df['new_column_name'] = df.apply(lambda x: your_function(x.column_1, x.column_2), axis=1)
위치:
3. 예:
다음 예제 데이터 프레임을 고려하십시오.
df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]})
값을 기반으로 원본 목록 mylist의 하위 목록을 포함하는 'col_3'이라는 새 열을 생성한다고 가정합니다. col_1과 col_2에 있습니다. 다음과 같이 get_sublist 함수를 정의할 수 있습니다.
def get_sublist(sta, end): return ['a', 'b', 'c', 'd', 'e', 'f'][sta:end+1]
이제 람다를 사용하여 이 함수를 다음과 같이 적용할 수 있습니다.
df['col_3'] = df.apply(lambda x: get_sublist(x.col_1, x.col_2), axis=1)
이렇게 하면 데이터 프레임에 다음과 같은 새 열 'col_3'이 생성됩니다. 원하는 하위 목록
4. 대안:
람다를 사용하는 것은 여러 데이터 프레임 열에 함수를 적용하기 위한 간결하고 다양한 접근 방식입니다. 그러나 보다 명시적인 방법을 선호하는 경우 Series를 입력으로 사용하는 사용자 정의 함수와 함께 apply() 메서드를 사용할 수도 있습니다. 이 접근 방식에는 행을 나타내는 단일 입력을 사용하고 필요에 따라 해당 특정 행을 조작하는 함수 정의가 포함됩니다.
위 내용은 Pandas DataFrame의 여러 열에 함수를 적용하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!