>백엔드 개발 >파이썬 튜토리얼 >Python의 단어 경계를 사용하여 문자열과 특수 문자를 어떻게 안정적으로 일치시킬 수 있습니까?

Python의 단어 경계를 사용하여 문자열과 특수 문자를 어떻게 안정적으로 일치시킬 수 있습니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-07 14:17:12950검색

How Can I Reliably Match Strings with Special Characters Using Python's Word Boundaries?

Python의 단어 경계 및 특수 문자

Python 정규 표현식에서 단어 경계 일치에 b 패턴을 사용할 때 다음과 같은 경우 예기치 않은 결과가 발생할 수 있습니다. 검색 패턴에는 대괄호나 중괄호와 같은 특수 문자가 포함되어 있습니다.

구체적으로 b는 다음 문자가 있는 단어 경계에서만 일치합니다. 단어 문자(영숫자 또는 밑줄)입니다. 즉, 예를 들어 bSortesindex[persons]{Sortes}는 Sortes 뒤에 특수 문자(}index)가 있기 때문에 테스트 Sortesindex[persons]{Sortes} 텍스트와 일치하지 않습니다.

적절하게 일치하는 경우 다음 솔루션을 고려하세요.

  • Adaptive Word 경계:

    • 문자열의 시작이나 끝 또는 단어 문자 상태가 다른 문자 사이에서 일치하는 적응형 단어 경계를 사용합니다.

      re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
  • 명확한 단어 경계:

    • 명확한 단어 경계를 사용하여 일치 양쪽에 단어 문자가 없도록 엄격히 요구합니다.

      re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
  • 단어가 아닌 단어를 명시적으로 처리 경계:

    • W 또는 $를 사용하여 비단어 경계를 명시적으로 처리합니다. 예:

      re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')

또한 단어 경계를 더 유연하게 정의하려면 부정 탐색을 사용하는 것이 좋습니다. 예를 들어, (?

위 내용은 Python의 단어 경계를 사용하여 문자열과 특수 문자를 어떻게 안정적으로 일치시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.