ホームページ  >  記事  >  バックエンド開発  >  Python で正規表現を使用して文字列間のテキストを抽出する方法

Python で正規表現を使用して文字列間のテキストを抽出する方法

DDD
DDDオリジナル
2024-10-21 20:08:02992ブラウズ

How to Extract Text Between Strings with Regular Expressions in Python?

正規表現を使用した文字列間のテキストの抽出

Python では、正規表現を利用して、より大きな文字列内の 2 つの指定された文字列の間にあるテキストを抽出できます。弦。次の例を考えてみましょう:

"Part 1. Part 2. Part 3 then more text"

あなたの目的は、「Part 1」と「Part 3」の間のテキスト、つまり「. Part 2. 」を分離することです。これを実現するには、re.search() 関数を使用します。

<code class="python">import re
s = 'Part 1. Part 2. Part 3 then more text'
match = re.search(r'Part 1\.(.*?)Part 3', s)
if match:
    text_between = match.group(1)
    print(text_between)</code>

この場合、正規表現 r'Part 1.(.*?)Part 3' は「.*?」を割り当てます。捕獲グループとして。 「?」は、このグループが貪欲でないことを保証します。つまり、正規表現を満たす可能な限り短い文字列をキャプチャします。 .* は任意の文字に一致し、.は改行を除く任意の文字を表します。

複数の出現がある場合は、代わりに re.findall() を使用できます。

<code class="python">matches = re.findall(r'Part 1(.*?)Part 3', s)
for match in matches:
    print(match)</code>

以上がPython で正規表現を使用して文字列間のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。