re.MULTILINE을 사용한 re.sub가 모든 발생을 대체하지 않는 이유
Python의 re.sub 함수는 기반 텍스트 대체를 수행하도록 설계되었습니다. 정규식에서는 캐럿 문자(^)의 일치 동작을 확장하기 위해 re.MULTILINE 플래그와 함께 자주 사용됩니다. 그러나 이 플래그를 사용하여 패턴의 모든 항목을 바꾸려고 시도하면 예기치 않은 결과가 발생할 수 있습니다.
문제 이해:
re.MULTILINE 공식 문서에는 다음과 같이 나와 있습니다. 문자열 내 각 줄의 시작 부분에서 캐럿 문자가 일치하도록 허용해야 합니다. 그러나 다음 예에서는 "//"의 모든 항목이 예상대로 제거되지는 않습니다.
import re s = """// The quick brown fox. // Jumped over the lazy dog.""" result = re.sub('^//', '', s, re.MULTILINE) print(result)
해결책:
불일치는 사용법에 있습니다. re.MULTILINE 플래그. 기본적으로 re.sub의 네 번째 인수는 플래그가 아닌 개수로 해석됩니다. 이 문제를 해결하려면 아래와 같이 명시적으로 인수라는 플래그를 사용할 수 있습니다.
result = re.sub('^//', '', s, flags=re.MULTILINE)
또는 정규 표현식을 re.compile 함수로 미리 컴파일하여 re.MULTILINE 플래그를 통합할 수도 있습니다.
regex = re.compile('^//', re.MULTILINE) result = re.sub(regex, '', s)
flags 인수를 지정하거나 원하는 플래그로 정규식을 미리 컴파일하면 re.sub 함수가 줄 바꿈에 관계없이 패턴의 모든 항목을 올바르게 대체합니다.
위 내용은 re.sub가 re.MULTILINE으로 모든 발생을 대체하지 않는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!