首頁  >  文章  >  後端開發  >  php—PCRE正規表示式條件子組

php—PCRE正規表示式條件子組

伊谢尔伦
伊谢尔伦原創
2016-11-21 17:12:261234瀏覽

可以使匹配器根據一個斷言的結果, 或者之前的一個捕獲子組是否匹配來條件式的匹配一個子組或在兩個可選子組中選擇。 條件子組的兩種語法如下:

(?(condition)yes-pattern)
(?(condition)yes-pattern|no-pattern)

如果條件滿足,使用 yes-pattern,其他情況使用 no-pattern(如果指定了)。 如果有超過 2 個的可選子組,會產生給一個編譯期錯誤。

條件一共有兩種。如果在(condition)的括號內是數字組成的文本, 條件在該數字代表的(之前的)子組得到匹配時滿足(即使用 yes-pattern)。 考慮下面的模式, 為了使其易於閱讀其中增加了一些空白字符(查看PCRE_EXTENDED 選項)並且將其分為三個部分: ( ( )? [^()]+ (?(1) ) )

模式的第一部分匹配一個可選的左括號,如果該字元出現, 設定其為第一個子組的捕獲子字串。第二部分符合一個或多個非括號字元。 第三部分是條件子組,它會測試第一個子組是否匹配,如果匹配到了, 也就是說目標字符串以左括號開始,條件為TRUE, 那麼使用yes-pattern 也就是這裡需要匹配一個右括號。其他情況下, 既然 no-pattern 沒有出現,那麼這個子群組就不符合任何東西。換句話說, 這個模式匹配一​​個沒有括號的或閉合括號包裹的字元序列。

如果條件式字串 (R),它在得到模式或子模式的遞歸呼叫時滿足。 在”最上級”, 條件總是false。

如果條件不是數字序列或(R),它就必須是一個斷言。這裡的斷言可以使任意的,積極, 消極,正向,後向都是可以的。考慮這個模式, 同樣為了方便閱讀, 增加了一些空白字符,並且在第二行有兩個可選路徑。

(?(?=[^a-z]*[a-z])
\d{2}-[a-z]{3}-\d{2}  |  \d{2}-\d{2}-\d{2} )

條件式一個正向積極斷言,匹配一個可選的非小寫字母字符序列緊接著一個小寫字母。 換一種說法,它測試目標中至少出現一個小寫字母,如果小寫字母發現, 目標匹配第一個可選分支,其他情況下它匹配第二個分支。 這個模式會符合兩種格式的字串:dd-aaa-dd 或 dd-dd-dd。 aaa 代表小寫字母, dd 是數字。


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn