ホームページ >バックエンド開発 >Python チュートリアル >Python で正規表現を使用して文字列間のテキストを抽出する方法
正規表現を使用した文字列間のテキストの一致
特定のテキスト内の 2 つの特定の文字列間のテキストを抽出するために、正規表現は強力な機能を提供します。道具。特に、Python の re モジュールを利用して、このタスクを効率的に実行できます。
たとえば、次のテキストがあるとします。
Part 1. Part 2. Part 3 then more text
「パート 1」と「パート」の間のテキストを分離するには3" の場合、次のような正規表現を作成できます。
<code class="python">import re pattern = r'Part 1\.(.*?)Part 3'</code>
この式では、「Part 1.(*?)Part 3」は、「Part」の間にある任意の文字シーケンス (.*?) と一致します。
re.search 関数を使用すると、検索を実行できます。
<code class="python">match = re.search(pattern, text) if match: result = match.group(1)</code>
re.search 関数は、一致するものが見つかった場合に Match オブジェクトを返します。 。 group(1) メソッドを使用してキャプチャされたテキストにアクセスし、最初のキャプチャ グループ (「パート 1」と「パート 3」の間のテキストに対応する) の内容を取得します。
出力:
>>> print(result) Part 2.
このアプローチにより、正規表現を使用して 2 つの特定の文字列間のテキストを柔軟かつ正確に抽出できるようになり、さまざまなテキスト処理シナリオに対する堅牢なソリューションになります。
以上がPython で正規表現を使用して文字列間のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。