Python Regex에서 반복되는 하위 패턴 캡처
복잡한 패턴을 일치시킬 때 반복되는 하위 패턴을 캡처하면 정규식 성능을 향상시킬 수 있습니다. Python 정규식에는 반복 캡처에 제한이 있지만 원하는 패턴을 효과적으로 캡처할 수 있는 해결 방법이 있습니다.
분할 및 연결
제공된 답변에서 제안된 한 가지 접근 방식은 다음과 같습니다. 처음에는 전체 패턴을 일치시키고 나중에 하위 패턴을 분할합니다. 이 접근 방식은 정규식을 단순화하지만 분할을 위한 추가 단계가 필요합니다. 예를 들어 이메일 주소 일치를 고려하세요.
import re pattern = r'(.+?)@(\w+\.\w+)' text = "yasar@webmail.something.edu.tr" match = re.match(pattern, text) if match: email_address, domain = match.groups() subdomains = domain.split(".")
정규식 그룹
패턴이 더 복잡하고 하위 패턴에 고유한 특징이 있는 경우 정규식 그룹(예: 괄호) )을 사용하여 직접 캡처할 수 있습니다. 다음 패턴을 고려하세요.
pattern = r'(\w+)?\((\d+) entries?\)'
이 패턴은 숫자와 텍스트 "entries"(또는 "entry")를 포함하는 단어 및 선택적 괄호 표현과 일치합니다. 캡처된 그룹은 일치 개체를 통해 액세스할 수 있습니다.
text = "Received 10 entries for yesterday" match = re.match(pattern, text) if match: word, count = match.groups() if word: print("Word:", word) if count: print("Count:", count)
이 접근 방식을 사용하면 복잡한 분할 루틴 없이 하위 패턴을 직접 캡처할 수 있습니다.
위 내용은 Python Regex가 반복되는 하위 패턴을 효과적으로 캡처할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!