데이터프레임 문자열 열을 두 개의 열로 분할하는 방법은 무엇입니까?
데이터 분석 영역에서 다음을 수행해야 하는 문자열 열이 있는 데이터프레임을 접하게 됩니다. 분할되는 것은 흔한 일입니다. 이 위업을 달성하려면 두 가지 필수 질문이 제기됩니다.
해결책은 pandas 시리즈의 다용도 str 속성, 특히 인덱싱 인터페이스:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
이 인덱싱 인터페이스와 튜플 압축 풀기를 활용하여 분할 요소가 있는 새 열을 생성할 수 있습니다.
df['A'], df['B'] = df['AB'].str.split('-').str
또는 Pandas는 편리한 내장 방법을 제공합니다. , str.split(), 문자열을 분할하고 자동으로 일련의 반환 목록:
df['AB_split'] = df['AB'].str.split('-')
이 목록을 별도의 열로 확장하려면 Expand=True 매개변수를 사용합니다.
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
분할 길이가 다양한 경우에는 Expand=True가 이를 적절하게 처리합니다. 일관된 열 길이 보장:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
이러한 기술을 통해 Pandas는 문자열 열을 효율적으로 분할하고 데이터 프레임을 재구성할 수 있도록 지원합니다. 특정 분석 요구 사항을 충족하세요.
위 내용은 Pandas DataFrame 문자열 열을 여러 열로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!