>  기사  >  백엔드 개발  >  정규 표현식을 사용하여 중간 텍스트를 추출하는 방법은 무엇입니까?

정규 표현식을 사용하여 중간 텍스트를 추출하는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-10-21 20:05:29597검색

How to Extract Intervening Text Using Regular Expressions?

정규 표현식이 포함된 텍스트 찾기

텍스트 데이터를 처리할 때 미리 정의된 패턴을 기반으로 특정 정보를 추출해야 하는 경우가 많습니다. 이 작업을 위한 강력한 도구 중 하나는 정의된 규칙에 따라 텍스트 문자열을 일치시키는 데 사용되는 문자 시퀀스인 정규식입니다. 이 경우 정규식을 사용하여 서로 다른 두 문자열 사이의 텍스트를 일치시키는 것이 목표입니다.

문제:

다음 텍스트를 고려하세요.

Part 1. Part 2. Part 3 then more text

우리의 목표는 문자열 "Part 1"과 "Part 3"을 검색하고 그 사이에 있는 모든 항목, 즉 ".Part 2."를 검색하는 것입니다.

해결책:

Python 2x를 사용하면 re 모듈과 정규식을 활용할 수 있습니다. 한 가지 접근 방식은 re.search 기능을 사용하는 것입니다.

import re

s = 'Part 1. Part 2. Part 3 then more text'
match = re.search(r'Part 1\.(.*?)Part 3', s)
if match:
    print(match.group(1))

이 코드는 "Part 1" 패턴과 그 뒤에 문자(".*?"로 표시됨)가 있고 "Part 3으로 끝나는 패턴을 검색합니다. ". 중간 텍스트를 포함하는 일치하는 부분은 match.group(1)에 저장되고 인쇄됩니다.

지정된 패턴이 여러 번 나타나는 경우 re.findall을 사용하는 대안도 있습니다.

matches = re.findall(r'Part 1(.*?)Part 3', s)
for match in matches:
    print(match)

이 코드는 "Part 1"과 "Part 3" 사이에 일치하는 모든 세그먼트를 검색하고 각각을 인쇄합니다. 두 방법 모두 정규식을 효과적으로 활용하여 지정된 문자열 사이에서 원하는 텍스트를 추출합니다.

위 내용은 정규 표현식을 사용하여 중간 텍스트를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.