>  기사  >  백엔드 개발  >  Python에서 여러 줄 텍스트 블록을 정규 표현식과 일치시키는 방법은 무엇입니까?

Python에서 여러 줄 텍스트 블록을 정규 표현식과 일치시키는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-10-25 10:25:17560검색

How to Match Multi-Line Text Blocks with Regular Expressions in Python?

Python에서 정규 표현식과 여러 줄 텍스트 블록 일치

Python에서 여러 줄 텍스트를 처리할 때 정규식 일치가 어려울 수 있습니다. . 예를 들어, "n"이 개행을 나타내는 다음 텍스트를 생각해 보세요.

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]
[repeat the above a few hundred times].

목표는 두 가지 요소를 캡처하는 것입니다:

  • "some Varying TEXT"
  • 단일 캡처 그룹으로 첫 번째 요소 아래 두 줄로 시작하는 모든 대문자 텍스트 줄(나중에 줄 바꿈을 제거할 수 있음).

다음 정규 표현식의 변형을 사용한 이전 시도는 실패:

re.compile(r"^>(\w+)$$(\[.$]+)^$", re.MULTILINE)
re.compile(r"(^[^>]\[\w\s]+)$", re.MULTILINE|re.DOTALL)

해결책:

여러 줄 텍스트를 올바르게 일치시키려면 다음 정규식을 사용하십시오.

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

이것은 패턴은 다음과 일치합니다.

  • 그룹 1: "some Varying TEXT"
  • 그룹 2: 두 줄로 시작하는 모든 대문자 텍스트 줄 "some Varying TEXT"

아래 줄:

  • ^ 및 $ 앵커는 각각 개행 바로 뒤와 앞의 위치와 일치합니다.
  • ?: 연산자는 개행 그룹을 캡처하지 않게 만듭니다.
  • .* 수량자는 하나 이상의 대문자 텍스트 줄을 캡처합니다.

대체 해결 방법:

대상 텍스트에 줄바꿈(n) 외에 다른 유형의 줄바꿈이 포함될 수 있는 경우 다음과 같은 보다 포괄적인 버전을 사용하세요.

re.compile(r"^(.+)(?:\n|\r\n?)((?:(?:\n|\r\n?).+)+)", re.MULTILINE)

위 내용은 Python에서 여러 줄 텍스트 블록을 정규 표현식과 일치시키는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.