ホームページ  >  記事  >  バックエンド開発  >  Python reモジュールの使い方を詳しく解説

Python reモジュールの使い方を詳しく解説

Patricia Arquette
Patricia Arquetteオリジナル
2023-09-05 09:34:121492ブラウズ

Python の re モジュールは、正規表現操作のコア モジュールの 1 つです。一般的に使用されるメソッドは次のとおりです: 1. re.match、文字列の開始位置からパターンの一致を試みます; 2. re.search、文字列内のパターンを検索します; 3. re.findall、文字列内のすべてのコンテンツを返しますパターン リストに一致するもの; 4. re.finditer、文字列内のパターンに一致するすべてのコンテンツのイテレータを返します; 5. re.split、一致する分割ルールに従って文字列を複数の部分に分割します。

Python reモジュールの使い方を詳しく解説

Python の re モジュールには、一般的に使用される次のメソッドが含まれています:

re.match(pattern, string): 文字列の開始位置からパターンとの一致を試み、開始位置が正常に一致しない場合は None を返します。

re.search(pattern, string): 文字列内のパターンを検索します。一致した場合は、最初に一致したオブジェクトを返し、そうでない場合は None を返します。

re.findall(pattern, string): パターンに一致する文字列内のすべてのコンテンツのリストを返します。

re.finditer(pattern, string): パターンに一致する文字列内のすべての内容の反復子を返します。

re.sub(pattern, repl, string, count=0): repl を使用して、文字列内のパターンに一致する部分のすべてまたは一部を置き換えます。 count パラメーターは、置換の数を指定するために使用されます。

re.split(pattern, string, maxsplit=0, flags=0): 一致する分割ルールに従って文字列を複数の部分に分割し、リストを返します。

re.escape(string): 文字列内の特殊文字の前にエスケープ文字「\」を追加して、特殊文字を通常の文字に変換します。

re.purge(): 正規表現コンパイル キャッシュをクリアして、不必要なコンパイルを回避します。

re.escape(string): 文字列内の特殊文字の前にエスケープ文字「\」を追加して、特殊文字を通常の文字に変換します。

これらのメソッドは、パターン マッチング、検索、置換、分割などを含むさまざまな正規表現操作を提供します。特定のニーズに応じて、適切な操作方法を選択できます。

Python の re モジュールは、正規表現操作のコア モジュールの 1 つです。正規表現は、テキストの照合、検索、置換を行うための強力なツールです。正規表現は、特別な構文を使用してパターンを表します。 一般的な正規表現構文の一部を次に示します:

. : 任意の文字 (改行を除く) と一致します。

#^ : 文字列の先頭と一致します。

$ : 文字列の末尾と一致します。

[...] : 文字を選択できる文字のセットを表します。たとえば、[A-Za-z] は、A ~ Z または a ~ z のいずれかの文字と一致します。

[^...] : セットに含まれない文字を示します。たとえば、[^A-Za-z] は、A ~ Z または a ~ z の文字を除く任意の文字に一致します。

[a-z] : 任意の小文字と一致します。

[A-Z] : 任意の大文字と一致します。

[0-9]: 任意の数値と一致します。

\d: [0-9] に相当する任意の 10 進数と一致します。

\D: [^0-9] と同等の数値以外の文字と一致します。

\s: [\t\n\r\f] に相当する任意の空白文字と一致します。

\S : 空白以外の文字と一致します。

\w : [a-zA-Z0-9_] に相当する任意の英数字と一致します。

\W : 英数字以外の文字と一致します。

\b : 任意の単語境界 (単語と空白の間) に一致します。たとえば、「w\b」は「works」の「w」とは一致しませんが、「world」の前の「w」と一致します。 「WV\b」も「WVREPUBLIC」の「WV」とは一致しませんが、「WEST VIRGINIA」の「WV」とは一致します。これは、次の文字が文字であるか数字であるかとは関係がないことに注意してください。

\B : 単語以外の境界 (単語と空白以外の境界) に一致します。たとえば、「w\B」は「world」の「w」と一致しますが、「what」の「w」とは一致しません。 「WV\B」も「WVREPUBLIC」の「WV」とは一致しませんが、「WEST VIRGINIA」の「WV」とは一致します。これは、前の文字が文字であるか数字であるかとは関係がないことに注意してください。

|: 選択を示します。たとえば、a|b|c は「a」、「b」、または「

」に一致します。

以上がPython reモジュールの使い方を詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。