Python 的 re.sub 和 re.MULTILINE 标志无法替换所有出现
Python 文档表明 re.MULTILINE 标志,当指定,允许“^”模式在字符串的开头和每行的开头匹配。然而,当将此标志与 re.sub 一起使用时,会出现令人困惑的行为。
考虑以下代码:
<code class="python">import re s = """// The quick brown fox. ... // Jumped over the lazy dog.""" print(re.sub('^//', '', s, re.MULTILINE))</code>
此代码旨在删除所有出现的“//”注释每行的开头。然而,输出意外地留下了一个未发生的事件:
The quick brown fox. // Jumped over the lazy dog.
理解问题
此行为的原因在于错误使用了第四个参数重新子功能。此参数旨在指定要替换的匹配项计数,而不是作为标志。在给定的代码中,re.MULTILINE(值为 8)被用作计数,而不是标志。
更正代码
至解决这个问题,有两种可能的方法:
<code class="python">print(re.sub('^//', '', s, flags=re.MULTILINE))</code>
<code class="python">print(re.sub(re.compile('^//', re.MULTILINE), '', s))</code>
这两种方法都正确使用 re.MULTILINE 作为标志,从而产生所需的行为:
The quick brown fox. Jumped over the lazy dog.
以上是为什么 `re.sub` 和 `re.MULTILINE` 不替换所有出现的情况?的详细内容。更多信息请关注PHP中文网其他相关文章!