使用正则表达式提取字符串之间的文本
在 Python 中,您可以利用正则表达式来提取位于较大字符串中两个指定字符串之间的文本。细绳。考虑以下示例:
"Part 1. Part 2. Part 3 then more text"
您的目标是隔离“Part 1”和“Part 3”之间的文本,即“.Part 2.”。为此,您可以使用 re.search() 函数:
<code class="python">import re s = 'Part 1. Part 2. Part 3 then more text' match = re.search(r'Part 1\.(.*?)Part 3', s) if match: text_between = match.group(1) print(text_between)</code>
在这种情况下,正则表达式 r'Part 1.(.*?)Part 3' 分配“.*?”作为捕获组。这 ”?”确保该组是非贪婪的,这意味着它将捕获满足正则表达式的最短可能字符串。 .* 匹配任何字符,.代表除换行符之外的任何字符。
如果存在多个出现,可以使用 re.findall() 代替:
<code class="python">matches = re.findall(r'Part 1(.*?)Part 3', s) for match in matches: print(match)</code>
以上是如何在Python中使用正则表达式提取字符串之间的文本?的详细内容。更多信息请关注PHP中文网其他相关文章!