正規表現を使用した介在テキストの検索
テキスト データを処理する場合、多くの場合、事前定義されたパターンに基づいて特定の情報を抽出する必要があります。このタスクのための強力なツールの 1 つは正規表現です。これは、定義されたルールに従ってテキスト文字列を照合するために使用される一連の文字です。この場合、正規表現を使用して 2 つの異なる文字列間のテキストを照合することを目的としています。
問題:
次のテキストを考えてみましょう:
Part 1. Part 2. Part 3 then more text
私たちの目標は、文字列「Part 1」と「Part 3」を検索し、その間にあるすべての「.Part 2.」を取得することです。
解決策:
Python 2x を使用すると、re モジュールを利用し、正規表現を利用できます。 1 つのアプローチは、re.search 関数を使用することです。
import re s = 'Part 1. Part 2. Part 3 then more text' match = re.search(r'Part 1\.(.*?)Part 3', s) if match: print(match.group(1))
このコードは、「Part 1」の後に任意の文字 (「.*?」で表される) が続き、「Part 3」で終わるパターンを検索します。 」。介在するテキストを含む一致部分は match.group(1) に保存され、出力されます。
指定されたパターンが複数回出現する場合、別のアプローチとして re.findall を使用することも含まれます。
matches = re.findall(r'Part 1(.*?)Part 3', s) for match in matches: print(match)
このコードは、「パート 1」と「パート 3」の間で一致するセグメントをすべて取得し、それぞれを出力します。どちらのメソッドも正規表現を効果的に利用して、指定された文字列の間にある目的のテキストを抽出します。
以上が正規表現を使用して介在するテキストを抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。