首頁  >  文章  >  後端開發  >  PHP—PCRE正規表示式子組(子模式)

PHP—PCRE正規表示式子組(子模式)

伊谢尔伦
伊谢尔伦原創
2016-11-21 17:19:541443瀏覽

子組透過圓括號分隔界定,它們可以嵌套。 將一個模式中的一部分標記為子組(子模式)主要是來做兩件事:

將可選分支局部化。例如,模式cat(arcat|erpillar|)匹配 ”cat”, “cataract”, “caterpillar” 中的一個,如果沒有圓括號的話,它匹配的則是 ”cataract”, “erpillar” 以及空字符串。

將子組設定為捕獲子組(上面定義的). 當整個模式匹配後,目標字串中匹配子組的部分將會透過 pcre_exec()() 的 ovector 參數回傳給呼叫者。 左括號從左至右出現的次序就是對應子組的下標(從 1 開始), 可以透過這些下標數字來取得捕獲子模式匹配結果。

例如,如果字串”the red king” 使用模式((red|white) (king|queen)) 進行匹配, 模式匹配到的結果是array(“red king”, ”red king”, “red” , “king”) 的形式, 其中第0 個元素是整個模式​​匹配的結果,後面的三個元素依次為三個子組匹配的結果。 它們的下表分別為 1, 2, 3。

事實上,圓括號履行的兩種功能並不總是有用的。 常常我們會有一種需求需要使用子群組進行分組, 但又不需要(單獨的)捕捉它們。 在子組定義的左括號後面緊跟著字串 ”?:” 會使得該子組不被單獨捕獲, 且不會對其後子組序號的計算產生影響。例如, 如果字串”the white queen” 匹配模式 ((?:red|white) (king|queen)),匹配到的結果會是array(“white queen”、“white queen”、“white queen”) ,的和king|queen 這兩個子組。 捕獲子組序號的最大值是 99, 最大允許擁有的所有子組(包括捕獲的和非捕獲的)的最大數量為 200。

為了方便簡寫,如果需要在非捕獲子組開始位置設定選項, 選項字母可以位於 ? 和 : 之間,例如:

(?i:saturday|sunday)
(?:(?i)saturday|sunday)

上面兩種寫法實際上是相同的模式。因為可選分支會從左到右嘗試每個分支, 並且選項沒有在子模式結束前被重置, 並且由於選項的設定會穿透對後面的其他分支產生影響,因此, 上面的模式都會匹配” SUNDAY” 以及”Saturday」。

在 PHP 4.3.3 中,子組可以使用 (?Ppattern) 的語法則命名。 這個子模式將會在配對結果中同時以其名稱和順序(數字下標)出現, PHP 5.2.2中又增加了兩種味子組命名的語法: (?pattern) 和 (?' name'pattern)。

有時需要多個匹配可以在一個正規表示式中選用子組。 為了讓多個子組可以共用一個後向引用數字的問題, (?| 語法允許複製數字。考慮下面的正則表達式匹配Sunday:

(?:(Sat)ur|(Sun))day

這裡當後向引用1 空時Sun 存儲在後向引用2中. 當後向引用2 不存在的時候 Sat 儲存在後向引用1中。 。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn