>백엔드 개발 >파이썬 튜토리얼 >정규식을 사용하여 Python에서 마커 사이의 하위 문자열을 추출하는 방법은 무엇입니까?

정규식을 사용하여 Python에서 마커 사이의 하위 문자열을 추출하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-12-07 01:42:10632검색

How to Extract Substrings Between Markers in Python Using Regular Expressions?

마커 간 하위 가닥 추출

문자열과 마커 쌍이 주어지면 이 마커 사이의 하위 문자열을 추출하는 작업입니다. 예를 들어 'gfgfdAAA1234ZZZuijjk' 문자열을 생각해 보세요. 목표는 '1234' 부분을 얻는 것입니다.

Python에서 정규식은 이 문제에 대한 강력한 솔루션을 제공합니다. 다음 코드 조각을 고려하십시오.

import re

text = 'gfgfdAAA1234ZZZuijjk'

m = re.search('AAA(.+?)ZZZ', text)
if m:
    found = m.group(1)

# found: 1234

'AAA(. ?)ZZZ' 표현식은 'AAA'와 'ZZZ' 사이의 모든 하위 문자열과 일치합니다. 표현식의 괄호는 하위 문자열을 그룹으로 캡처하고 '. ?' 수량자는 탐욕스럽지 않게 임의 개수의 문자와 일치하는지 확인합니다.

re.search() 함수는 텍스트에서 첫 번째 패턴 발생을 찾고 캡처된 그룹이 포함된 일치 개체를 반환합니다. . group(1) 메서드는 마커 사이의 하위 문자열을 추출하여 발견된 변수에 할당합니다.

또는 try-Exception 블록이 잠재적인 오류를 처리할 수 있습니다.

import re

text = 'gfgfdAAA1234ZZZuijjk'

try:
    found = re.search('AAA(.+?)ZZZ', text).group(1)
except AttributeError:
    # AAA, ZZZ not found in the original string
    found = '' # Your error handling here

# found: 1234

이 접근 방식은 다음을 보장합니다. group(1) 메서드가 실패할 때 발생하는 AttributeError를 처리하므로 텍스트에 마커가 없어도 프로그램이 계속 실행됩니다.

위 내용은 정규식을 사용하여 Python에서 마커 사이의 하위 문자열을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.