>  기사  >  백엔드 개발  >  Python에서 정규 표현식을 사용하여 문자열 사이의 텍스트를 추출하는 방법은 무엇입니까?

Python에서 정규 표현식을 사용하여 문자열 사이의 텍스트를 추출하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-21 20:08:02992검색

How to Extract Text Between Strings with Regular Expressions in Python?

정규 표현식을 사용하여 문자열 사이의 텍스트 추출

Python에서는 정규 표현식을 활용하여 더 큰 문자열 내에서 지정된 두 문자열 사이에 있는 텍스트를 추출할 수 있습니다. 끈. 다음 예를 고려하십시오.

"Part 1. Part 2. Part 3 then more text"

귀하의 목표는 "Part 1"과 "Part 3" 사이의 텍스트를 분리하는 것입니다. 즉, ". Part 2. "입니다. 이를 달성하려면 re.search() 함수를 사용할 수 있습니다.

<code class="python">import re
s = 'Part 1. Part 2. Part 3 then more text'
match = re.search(r'Part 1\.(.*?)Part 3', s)
if match:
    text_between = match.group(1)
    print(text_between)</code>

이 경우 정규식 r'Part 1.(.*?)Part 3'은 ".*?"를 할당합니다. 캡처 그룹으로. "?" 이 그룹이 탐욕스럽지 않은지 확인합니다. 즉, 정규식을 충족하는 가장 짧은 문자열을 캡처합니다. .*는 모든 문자와 일치하며 . 개행 문자를 제외한 모든 문자를 나타냅니다.

여러 항목이 있는 경우 대신 re.findall()을 사용할 수 있습니다.

<code class="python">matches = re.findall(r'Part 1(.*?)Part 3', s)
for match in matches:
    print(match)</code>

위 내용은 Python에서 정규 표현식을 사용하여 문자열 사이의 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.