>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame의 문자열 열을 두 개의 새 열로 효율적으로 분할하는 방법은 무엇입니까?

Pandas DataFrame의 문자열 열을 두 개의 새 열로 효율적으로 분할하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-24 12:55:14896검색

How to Efficiently Split a String Column in a Pandas DataFrame into Two New Columns?

Dataframe 문자열 열을 두 개의 열로 분할하는 방법은 무엇입니까?

TL;DR 버전 :

텍스트 열이 있는 간단한 경우 구분 기호를 사용하고 두 개의 열을 생성하려는 경우 가장 간단한 해결책은 다음과 같습니다.

df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)

자세히:

Andy Hayden의 접근 방식은 str의 힘을 효과적으로 보여줍니다. 추출() 메소드. 그러나 알려진 구분 기호에 대한 간단한 분할의 경우 .str.split() 메서드로 충분합니다. 문자열의 열(시리즈)에 대해 작동하고 목록의 열(시리즈)을 반환합니다.

열의 .str 속성을 사용하면 열의 각 요소를 문자열로 처리하고 메서드를 효율적으로 적용할 수 있습니다. 여기에는 인덱스로 문자열의 각 요소를 가져오는 인덱싱 인터페이스가 있어 .str.split()에서 반환된 목록을 쪼개고 쪼갤 수 있습니다.

Python 튜플 압축 풀기를 사용하면 다음에서 두 개의 별도 열을 생성할 수 있습니다. 다음을 사용하여 목록:

df['A'], df['B'] = df['AB'].str.split('-', n=1).str

또는 .str.split()의 Expand=True 매개변수를 활용하여 두 개를 직접 생성할 수 있습니다. 열:

df[['A', 'B']] = df['AB'].str.split('-', n=1, expand=True)

expand=True 버전은 "분할"이 누락된 열에 None 값을 삽입하여 이러한 경우를 처리하므로 길이가 다른 분할을 처리할 때 유리합니다.

위 내용은 Pandas DataFrame의 문자열 열을 두 개의 새 열로 효율적으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.