>  기사  >  백엔드 개발  >  Python은 원하는 수의 구분 기호에 대해 문자열을 분할합니다(코드 첨부).

Python은 원하는 수의 구분 기호에 대해 문자열을 분할합니다(코드 첨부).

不言
不言앞으로
2018-11-27 15:50:153077검색

이 기사는 Python이 여러 구분 기호로 문자열을 분할하는 것에 관한 것입니다. 이는 특정 참조 값을 가지고 있으므로 도움이 필요할 수 있습니다.

1. 요구 사항

문자열을 여러 필드로 분할해야 하지만 구분 기호(및 구분 기호 사이의 공백)는 분할할 수 없습니다. 문자열 전체에서 일관됩니다.

2. 솔루션

문자열 객체의 분할() 메서드는 매우 간단한 상황만 처리할 수 있으며 여러 구분 기호를 지원하지 않습니다. 캐릭터를 둘러싼 다양한 공간에 대해 알아보세요. 보다 유연한 기능이 필요한 경우 re.split() 메소드를 사용해야 합니다:

import re
line='abc def ; ghi, jkl,mno, pkr'
#分隔符:分号,都逗号,空格符,前后可以跟着任意数量的额外空格
result=re.split(r'\s*[;,\s]\s*',line)
print(result)

결과:

['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr']

3.

re.split()은 구분 기호에 여러 패턴을 지정할 수 있으므로 유용합니다. 예를 들어 위 솔루션에서 구분 기호는 세미콜론, 쉼표, 공백이며 그 뒤에는 원하는 만큼의 추가 공백이 올 수 있습니다. str.split()에서 얻은 결과와 마찬가지로 최종 결과는 필드 목록입니다.

re.split()을 사용할 때 정규식 패턴의 캡처 그룹이 괄호 안에 포함되는지 주의해야 합니다.

캡처 그룹을 사용하는 경우 일치하는 텍스트도 최종 결과에 포함됩니다. 예를 들어, 다음 사례를 살펴보십시오.

import re
line='abc def ; ghi, jkl,mno, pkr'
result=re.split(r'\s*(;|,|\s)\s*',line)
print(result)
결과:

['abc', ' ', 'def', ';', 'ghi', ',', 'jkl', ',', 'mno', ',', 'pkr']
특정 컨텍스트에서 구분 기호를 가져오는 것도 유용할 수 있습니다. 예를 들어 구분 문자를 사용하여 문자열 출력을 개선합니다.

import re
line='abc def ; ghi, jkl,mno, pkr'
result=re.split(r'\s*(;|,|\s)\s*',line)

values=result[::2]
delimiters=result[1::2]+['']

print(values)
print(delimiters)

last=''.join(v+d for v,d in zip(values,delimiters))
print(last)
결과:

['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr']
[' ', ';', ',', ',', ',', '']
abc def;ghi,jkl,mno,pkr
결과에 구분 문자를 표시하고 싶지 않지만 여전히 원하는 경우 기호를 사용하여 정규 표현식을 사용하려면 표현식 패턴을 그룹화하려면 (?:...) 형식으로 지정된 비캡처 그룹을 사용해야 합니다. 예는 다음과 같습니다:

import re
line='abc def ; ghi, jkl,mno, pkr'
result=re.split(r'\s*(?:;|,|\s)\s*',line)

print(result)
결과:

['abc', 'def', 'ghi', 'jkl', 'mno', 'pkr']

위 내용은 Python은 원하는 수의 구분 기호에 대해 문자열을 분할합니다(코드 첨부).의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 segmentfault.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제