>백엔드 개발 >파이썬 튜토리얼 >정규식 단어 경계(\b)가 특수 문자와 함께 잘못 동작하는 이유는 무엇입니까?

정규식 단어 경계(\b)가 특수 문자와 함께 잘못 동작하는 이유는 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-09 05:26:17643검색

Why Do Regular Expression Word Boundaries (b) Misbehave with Special Characters?

특수 문자가 포함된 표현식의 단어 경계 동작

정규 표현식을 사용하여 단어를 일치시킬 때 b 경계 패턴은 때때로 예상치 못한 결과를 생성할 수 있으며, 특히 단어에 특수 문자가 포함된 경우 더욱 그렇습니다.

"Test Sortesindex[persons]{Sortes} text"라는 문구를 생각해 보세요. bb를 사용하여 전체 구문을 일치시키면 "Sortes"와 같은 구문만 일치하는 것을 방지할 수 있습니다. 그러나 이는 단어 경계의 특정 특성으로 인해 발생하지 않습니다.

b 특수 문자를 사용한 동작

공식적으로 b는 단어 문자(w)와 비단어 문자 사이의 경계와 일치합니다. (W) 또는 문자열의 시작/끝입니다. 단어 경계 패턴 바로 뒤에 [ 또는 }와 같은 특수 문자가 오는 경우 b에는 특수 문자 뒤에 단어 문자만 있으면 됩니다.

해결책: 적응형 또는 모호하지 않은 단어 경계

해결 방법 이번 호에서는 적응어 경계 또는 모호하지 않은 단어 경계를 사용할 수 있습니다.

적응 단어 경계 경계 패턴 양쪽에 있는 단어와 단어가 아닌 문자의 모든 조합을 처리합니다.

re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')

명확한 단어 경계 패턴 양쪽에 단어 문자가 필요하지 않습니다.

re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')

올바른 경계 유형 선택

적응형 단어 경계는 더욱 다양해졌습니다. 그러나 단어가 아닌 문자의 앞뒤에는 허용됩니다. 명확한 단어 경계는 더 엄격하여 주변 단어 문자가 없도록 보장합니다.

사용자 정의

적응적이고 명확한 단어 경계에 사용되는 둘러보기 패턴은 일치 작업의 특정 요구 사항에 따라 사용자 정의할 수 있습니다. 예를 들어, 패턴 주위에 문자가 아닌 문자만 일치시키려면 w 대신 [^Wd_]를 사용하세요.

위 내용은 정규식 단어 경계(\b)가 특수 문자와 함께 잘못 동작하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.