DataFrame 열 문자열을 효율적으로 정리
DataFrame 열의 문자열에서 원하지 않는 부분을 제거하는 것은 데이터 정리의 일반적인 작업입니다. 이를 위해서는 특정 문자, 접두사 또는 접미사를 제거해야 할 수 있습니다.
다음 데이터 구조를 사용하는 DataFrame을 고려해보세요.
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
우리의 목표는 각 '결과'에서 숫자 부분을 추출하는 것입니다. ' 문자열, ' ' 및 '-' 기호와 후행 문자를 제거합니다. 원하는 출력은 다음과 같아야 합니다.
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
이를 달성하기 위해 Python의 람다 함수를 활용할 수 있습니다. 다음 코드는 '결과' 열 데이터를 효과적으로 정리합니다.
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
이 람다 함수는 '결과' 열의 각 요소를 반복합니다.
이러한 작업을 적용하면 '결과' 열의 문자열에서 원하지 않는 부분이 제거되어 원하는 결과를 얻을 수 있습니다.
위 내용은 Python의 Lambda 함수를 사용하여 DataFrame 열 문자열을 효율적으로 정리하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!