>  기사  >  백엔드 개발  >  Python Regex가 반복되는 하위 패턴을 효과적으로 캡처할 수 있습니까?

Python Regex가 반복되는 하위 패턴을 효과적으로 캡처할 수 있습니까?

DDD
DDD원래의
2024-11-24 10:46:11606검색

Can Python Regex Capture Repeated Subpatterns Effectively?

Python Regex에서 반복되는 하위 패턴 캡처

복잡한 패턴을 일치시킬 때 반복되는 하위 패턴을 캡처하면 정규식 성능을 향상시킬 수 있습니다. Python 정규식에는 반복 캡처에 제한이 있지만 원하는 패턴을 효과적으로 캡처할 수 있는 해결 방법이 있습니다.

분할 및 연결

제공된 답변에서 제안된 한 가지 접근 방식은 다음과 같습니다. 처음에는 전체 패턴을 일치시키고 나중에 하위 패턴을 분할합니다. 이 접근 방식은 정규식을 단순화하지만 분할을 위한 추가 단계가 필요합니다. 예를 들어 이메일 주소 일치를 고려하세요.

import re

pattern = r'(.+?)@(\w+\.\w+)'
text = "yasar@webmail.something.edu.tr"

match = re.match(pattern, text)
if match:
    email_address, domain = match.groups()
    subdomains = domain.split(".")

정규식 그룹

패턴이 더 복잡하고 하위 패턴에 고유한 특징이 있는 경우 정규식 그룹(예: 괄호) )을 사용하여 직접 캡처할 수 있습니다. 다음 패턴을 고려하세요.

pattern = r'(\w+)?\((\d+) entries?\)'

이 패턴은 숫자와 텍스트 "entries"(또는 "entry")를 포함하는 단어 및 선택적 괄호 표현과 일치합니다. 캡처된 그룹은 일치 개체를 통해 액세스할 수 있습니다.

text = "Received 10 entries for yesterday"

match = re.match(pattern, text)
if match:
    word, count = match.groups()
    if word:
        print("Word:", word)
    if count:
        print("Count:", count)

이 접근 방식을 사용하면 복잡한 분할 루틴 없이 하위 패턴을 직접 캡처할 수 있습니다.

위 내용은 Python Regex가 반복되는 하위 패턴을 효과적으로 캡처할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.