re.sub 및 플래그를 사용한 예기치 않은 대체
Python 문서에는 re.MULTILINE 플래그가 캐럿 문자(^)를 허용한다고 나와 있습니다. 각 줄의 시작 부분에서 일치합니다. 그러나 re.sub와 함께 이 플래그를 사용하면 예기치 않은 동작이 발생할 수 있습니다.
다음 예를 고려하세요.
<code class="python">import re s = """// The quick brown fox. // Jumped over the lazy dog.""" result = re.sub('^//', '', s, re.MULTILINE) print(result)</code>
예상되는 결과는 "//"로 시작하는 모든 줄이 다음과 같습니다. 빈 문자열로 대체되고 다음만 남깁니다.
The quick brown fox. Jumped over the lazy dog.
그러나 실제 결과는 다음과 같습니다.
The quick brown fox. // Jumped over the lazy dog.
문제 이유
문제는 re.sub 함수가 최대 대체 횟수에 대한 네 번째 인수를 허용하기 때문에 발생합니다. 예제에서 re.MULTILINE은 플래그가 아닌 개수로 잘못 사용되었습니다.
해결 방법
이 동작을 수정하려면 명명된 인수를 사용하여 플래그:
<code class="python">result = re.sub('^//', '', s, flags=re.MULTILINE)</code>
또는 re.sub와 함께 사용하기 전에 원하는 플래그로 정규식을 컴파일할 수 있습니다.
<code class="python">regex = re.compile('^//', re.MULTILINE) result = re.sub(regex, '', s)</code>
re.MULTILINE 플래그를 올바르게 지정하면 문자열 내의 위치에 관계없이 ^// 패턴이 나타나는 모든 항목이 대체되도록 할 수 있습니다.
위 내용은 re.sub가 re.MULTILINE 플래그와 함께 예기치 않게 동작하는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!