這次帶給大家正規裡的子表達式使用詳解,正規裡子表達式使用的注意事項有哪些,下面就是實戰案例,一起來看一下。
註:在所有例子中正規表示式匹配結果包含在原始文字中的【和】之間,有的例子會使用java來實現,如果是java本身正規表示式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
一、問題引入
首先來看一個例子,有的短語如Windows 2000雖然是多個單字組成,但其實是一個整體,HTML頁面中可以使用非換行空格( 即non-breaking space)讓它在瀏覽器中顯示在一行上,現在來符合多個這樣的空格:
文字:Your operation systemis Windows 2000.
正規表示式:nbsp;{2,}
#結果:Your operation systemis Windows 2000.
#分析:這裡使用模式想匹配2個或2個以上的非換行空格,但是從結果可以看出,沒有匹配到任何東西,因為nbsp;{2,}這個模式只能匹配到像nbsp;;;; ;;;這樣以nbsp開頭,2個或2個以上連續分號的文字。
因為前面說過的重複匹配都是緊挨著重複匹配元字符之前的那個字符的多次重複,但是,如果我們想對一個字符串進行多次匹配,又該怎麼做呢?
二、子表達式
從上面我們引出子表達式。子表達式是一個大的表達式的一部分,把一個表達式劃分為多個子表達式的目的是為了把那些子表達式當作一個獨立的元素來使用。子表達式必須用(和)括起來。所以,前面的例子中正規表示式應該寫成(nbsp;){2,}。
來看一個符合有效年份的正規表示:
文字:1988-11-13
正規表示式:(19| 20)\d{2}
結果:【1988】-11-13
##分析:在這個例子中,為了排除沒有意義的年份,把年份的前兩位數字限定為19或20,|是正規表示式裡的或操作符。這裡必須把19|20放到一個子表達式裡,即(19|20),否則只能配對到以20開頭的年份,三、子表達式的嵌套
子表達式允許嵌套,而且允許多層嵌套,而嵌套層次在理論上沒有限制。 在表達式((A)(B(C))) 中,存在以下幾個子表達式:1 ((A)(B(C)))
2 (A)
#3 (B(C))
4 (C )
共4個,第0個總是代表整個表達式。在後面的回溯參考中會介紹到透過\n(n是子表式的編號)來引用子表達式。 子表達式嵌套的範例可參考後面符合IPV4位址的正規表示式。相信看了本文案例你已經掌握了方法,更多精彩請關注php中文網其它相關文章! 推薦閱讀:
以上是正規裡的子表達式使用詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!