>  기사  >  백엔드 개발  >  Regex가 중첩된 괄호를 처리할 수 있나요? 제한 사항 및 파이파싱 솔루션 탐색.

Regex가 중첩된 괄호를 처리할 수 있나요? 제한 사항 및 파이파싱 솔루션 탐색.

DDD
DDD원래의
2024-11-01 00:41:28314검색

Can Regex Handle Nested Parentheses? Exploring Limitations and pyparsing Solutions.

Python의 중첩 괄호 일치: 정규식 제한 사항 및 대체 솔루션

문자열에서 중첩 괄호를 일치시키는 것은 어려운 작업일 수 있으며, 특히 정규식(regex)을 사용하는 경우 더욱 그렇습니다. 다음 Python 코드를 고려해 보세요.

<code class="python">import re

p = re.compile('\(.+\)')
str = '(((1+0)+1)+1)'
print(p.findall(str))</code>

이 코드는 단일 정규식 패턴을 사용하여 str 변수 내에서 모든 수학 표현식과 유사한 문자열을 일치시키려고 시도합니다. 그러나 개별 중첩 괄호를 식별하는 것이 목표임에도 불구하고 전체 표현식만 일치합니다.

정규식이 짧은 이유

정규식 패턴은 중첩 구문을 처리하는 능력이 제한되어 있습니다. 효과적으로. (. ) 표현식은 괄호로 묶인 모든 문자열과 일치하지만 서로 다른 중첩 수준을 구별할 수는 없습니다. 결과적으로 가장 바깥쪽 괄호 안에 모든 것을 그룹화하고 안쪽 괄호는 간과합니다.

pyparsing을 사용한 포괄적인 솔루션

regex의 한계를 극복하기 위해 pyparsing이라는 고급 라이브러리를 활용할 수 있습니다. , 복잡한 문자열 패턴을 처리하기 위한 특수 파서를 제공합니다. 다음은 pyparsing을 사용한 예입니다.

<code class="python">import pyparsing

thecontent = pyparsing.Word(pyparsing.alphanums) | '+' | '-'
parens = pyparsing.nestedExpr('(', ')', content=thecontent)</code>

이 코드는 개별 문자 또는 산술 연산자를 나타내는 thecontent와 중첩된 괄호 구조를 정의하는 parens라는 두 가지 요소를 정의합니다.

실용적 사용법

이 솔루션을 다음과 같이 시연해 보겠습니다. 예:

<code class="python">res = parens.parseString("((12 + 2) + 3)")
print(res.asList())</code>

출력:

[[['12', '+', '2'], '+', '3']]

주요 장점

중첩 괄호 일치에 pyparsing을 사용하면 정규 표현식에 비해 몇 가지 장점이 있습니다.

  • 유연성: 파이파싱 훨씬 더 복잡하고 복잡한 패턴 일치 규칙을 허용합니다.
  • 중첩 처리: 중첩 수준을 명시적으로 고려하고 내부 구조를 효과적으로 캡처합니다.
  • 사용자 정의: pyparsing을 사용하면 일치 규칙을 특정 항목에 맞게 조정할 수 있습니다.

결론

정규 표현식은 간단한 문자열 일치에 유용할 수 있지만 괄호와 같은 중첩 구문을 처리하는 데 어려움을 겪습니다. 이러한 시나리오의 경우 pyparsing과 같은 전문 구문 분석 라이브러리는 강력하고 유연한 대안을 제공하여 정확하고 의미 있는 일치 결과를 보장합니다.

위 내용은 Regex가 중첩된 괄호를 처리할 수 있나요? 제한 사항 및 파이파싱 솔루션 탐색.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.