>  기사  >  백엔드 개발  >  DataFrame의 문자열 열에서 원하지 않는 문자를 제거하는 방법은 무엇입니까?

DataFrame의 문자열 열에서 원하지 않는 문자를 제거하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-06 17:53:02817검색

How to Remove Unwanted Characters from String Columns in a DataFrame?

DataFrame 열의 문자열에서 원하지 않는 문자 제거

문자열 데이터가 포함된 데이터세트를 처리할 때 내부에서 의미 있는 정보를 추출해야 하는 경우가 많습니다. 문자열. 그러나 원하지 않는 문자나 형식으로 인해 원하는 데이터가 모호해질 수 있습니다. 이 시나리오의 목표는 원치 않는 부분을 효율적으로 제거하는 것입니다.

다음 데이터가 포함된 DataFrame 열이 있다고 가정합니다.

time result
09:00 52A
10:00 62B
11:00 44a
12:00 30b
13:00 -110a

우리의 목표는 데이터를 잘라서 ' ' 또는 '-' 접두사 및 'a' 또는 'b' 접미사. 원하는 출력은 다음과 같습니다.

time result
09:00 52
10:00 62
11:00 44
12:00 30
13:00 110

이를 달성하기 위해 맵 메소드 내에서 람다 함수를 사용합니다. 다음 코드 조각이 작업을 수행합니다.

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

lstrip 함수는 선행 ' ' 또는 '-' 문자를 제거하는 반면, rstrip 함수는 후행 'a', 'A', 'b'를 제거합니다. 'B' 또는 'c' 문자입니다. 출력은 원하는 잘린 데이터가 포함된 DataFrame입니다.

위 내용은 DataFrame의 문자열 열에서 원하지 않는 문자를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.