>  기사  >  백엔드 개발  >  Pandas를 사용하여 특정 구분 기호를 기반으로 텍스트 문자열을 여러 행으로 분할하려면 어떻게 해야 합니까?

Pandas를 사용하여 특정 구분 기호를 기반으로 텍스트 문자열을 여러 행으로 분할하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-10 08:40:03375검색

How can I split text strings into multiple rows based on specific delimiters using Pandas?

텍스트를 여러 행으로 분할하는 Pandas 방법

문제:
큰 CSV 파일에 열이 포함되어 있습니다. 특정 구분 기호를 기반으로 여러 행으로 분할해야 하는 텍스트 문자열이 있습니다. 목표는 분할 텍스트의 각 세트에 대해 별도의 행을 생성하는 것입니다.

Pandas를 사용한 솔루션:

  1. 다음을 사용하여 첫 번째 구분 기호(공백)로 텍스트를 분할합니다. str.split(' ').
  2. apply() 함수를 적용하여 목록의 각 문자열을 초 단위로 분할합니다. 구분 기호(콜론)를 사용하여 시리즈로 변환합니다.
  3. Stack()을 사용하여 결과 DataFrame을 단일 열로 변환하고 인덱스를 재설정합니다.
  4. 열 이름을 'Seatblocks'로 바꿉니다.
  5. DataFrame에서 원래 'Seatblocks' 열을 삭제하세요.
  6. 새로운 열에 합류하세요 'Seatblocks' 열을 원본 DataFrame으로 변환합니다.

공백과 콜론으로 분할:

출력 예:

분할 콜론:

출력 예:

위 내용은 Pandas를 사용하여 특정 구분 기호를 기반으로 텍스트 문자열을 여러 행으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.