首頁  >  文章  >  後端開發  >  php—PCRE正規表示式一次性子組

php—PCRE正規表示式一次性子組

伊谢尔伦
伊谢尔伦原創
2016-11-21 17:13:481207瀏覽

對於同時有最大值和最小值量詞限制的重複項, 在匹配失敗後, 緊接著會以另外一個重複次數重新評估是否能使模式匹配。 當模式的作者明確知道執行上沒有問題時, 透過改變匹配的行為或使其更早的匹配失敗以阻止這種行為是很有用的。

考慮一個例子,模式d+foo 應用到目標行 123456bar 時:

在匹配了6 個數字後匹配”foo” 時失敗,通常的行為時匹配器嘗試使d+ 只匹配5 個數字, 只匹配4 個數字,在最終失敗之前依序嘗試。 一次性子組提供了一種特殊的意義, 當模式的一部分得到匹配後,不再對其進行重新評估, 因此匹配器在第一次匹配 ”foo” 失敗後就能立刻失敗。語法符號是另外一種特殊的括號, 以(?> 開始,例如(?>d+)bar。

這種括號對模式的一部分提供了”鎖定”,當它包含一個匹配之後, 會阻止未來模式失敗後對它內部的後向回溯。字串等同於一個獨立的模式匹配。都會調整要匹配的數字的個數以便模式的其他部分匹配, (?>d+) 卻僅能匹配整個數字序列。

一次性子組可以和後瞻斷言結合使用來指定在目標字串末尾的有效匹配。的,PCRE會從目標中查找每一個”a” 然後查看是否緊接著會匹配模式的剩餘部分。後(因為緊接著不是”a”), 它會回溯所有的匹配,依次吐出最後1 個字符,倒數第2 個字符等等。不能很好的退出。末尾的後四個字元做了一個測試。可以無限重複且內部有無限重複元素時, 使用一次性子組是避免一些失敗匹配消耗大量時間的唯一途徑。由 閉合的數字字元緊跟著! 或?。可以用於兩種重複規則,並且需要為兩種重複規則都分配進行嘗試。快速報錯有優化。 它們會記錄最後需要匹配的單個字符,當它們沒有出現在字串中時快速報錯。 ) 若模式修改為 ((?>D+)|)*[!?] 就會快速得到錯誤。 (譯註: 對於這裡給出的模式,當目標字串更長的時候,消耗時間會迅速增加,慎用。)

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn