ホームページ >バックエンド開発 >PHPチュートリアル >PHP - PCRE 正規表現サブグループ (サブパターン)
サブグループは括弧で区切られており、入れ子にすることができます。 パターンの一部をサブグループ (サブパターン) としてマークすると、主に 2 つのことが行われます:
オプションのブランチをローカライズします。たとえば、パターン cat(arcat|erpillar|) は、「cat」、「cataract」、「caterpillar」のいずれかと一致します。かっこがない場合は、「cataract」、「erpillar」、および空の文字列と一致します。
サブグループをキャプチャ サブグループ (上で定義) として設定します。パターン全体が一致すると、サブグループに一致するターゲット文字列の部分が、pcre_exec()() の ovector パラメーターを通じて呼び出し元に返されます。 左括弧が左から右に表示される順序は、対応するサブグループの添字です (1 から始まります)。キャプチャ サブパターンの一致結果は、これらの添字番号を通じて取得できます。
たとえば、文字列「the red king」がパターン ((red|white) (king|queen)) を使用して照合された場合、パターン照合の結果は array("red king", "red king", "red " 、"king")、0 番目の要素はパターン一致全体の結果であり、次の 3 つの要素は 3 つのサブグループ一致の結果です。 以下の表はそれぞれ 1、2、3 です。
実際、括弧で囲まれた 2 つの機能は常に役立つとは限りません。 多くの場合、グループ化にサブグループを使用する必要がありますが、サブグループを (個別に) キャプチャする必要はありません。 サブグループ定義の左括弧の直後に文字列「?:」を続けると、サブグループが個別にキャプチャされるのを防ぎ、後続のサブグループのシーケンス番号の計算には影響しません。たとえば、文字列「the white queen」がパターン ((?:red|white) (king|queen)) に一致する場合、一致した結果は array("white queen", "white queen", "white queen") になります。 ) 、 と king|queen の 2 つのサブグループ。 キャプチャされたサブグループの最大数は 99 で、許可されるすべてのサブグループ (キャプチャされたものとキャプチャされていないものを含む) の最大数は 200 です。
省略の便宜上、非キャプチャサブグループの先頭にオプションを設定する必要がある場合は、オプション文字を ? と : の間に置くことができます。例:
(?i:saturday|sunday) (?:(?i)saturday|sunday)
上記の 2 つの書き方は実際には同じパターン。オプションのブランチは各ブランチを左から右に試行し、オプションはサブモードの終了前にリセットされず、オプションの設定は後続の他のブランチに影響するため、上記のパターンは一致します。「SUNDAY」と「」土曜日"。
PHP 4.3.3 では、(?P8a11bc632ea32a57b3e3693c7987c420pattern) 構文を使用してサブグループに名前を付けることができます。 このサブパターンは、名前と順序 (数値添え字) の両方で一致結果に表示されます。PHP 5.2.2 では、サブパターンに名前を付けるための 2 つの構文 (?8a11bc632ea32a57b3e3693c7987c420pattern) と (? 'name'pattern) が追加されています。
複数の一致が必要な場合は、正規表現でサブグループを使用できます。 複数のサブグループが後方参照番号を共有できるようにするには、(?| 構文で番号をコピーできます。日曜日に一致する次の正規表現を考えてみましょう:
(?:(Sat)ur|(Sun))day
ここで、後方参照 1 が空の場合、太陽は後方参照 2 に格納されます。後方参照 2 が空でない場合、後方参照 2 に格納されます。この問題を解決するには、(?| 変更パターンを使用します:
(?|(Sat)ur|(Sun))day
このパターンを使用すると、太陽と土曜日の両方が後方参照 1 に格納されます。