之前寫了一篇關於正則新手入門的文章,本以為對正則表達式相對比較了解但是今天我又遇到了一個坑,可能是自己不夠細心的原因吧,今天就著重和大家分享一下javascript正則表達式中的分組。如果你對JS正規表示式不夠理解 可以點擊這裡了解更多。
分組在正則中用的還是比較廣的,我所理解的分組就是一對括號() ,每一對括號就代表了一個分組,
分組可以分為:
捕獲性分組
非捕獲性分組
捕獲性分組
捕獲性分組會在像match exec這樣的函數中以第二項,第三項的形式得到相應分組的結果。先來看一個例子吧
var reg = /test(\d+)/; var str = 'new test001 test002'; console.log(str.match(reg)); //["test001", "001", index: 4, input: "new test001 test002"]
程式碼中(d+)是一個分組(有些人也叫他子模式),但是表示的都是同一個意思,上面的例子中test001是完全匹配的結果,
然而分組的匹配是從整個完全匹配結果(也就是test001)中來查找與子模式d+匹配的字符,這裡顯然是001.
但是今天遇到的情況是這樣的
var reg = /test(\d)+/; var str = 'new test001 test002'; console.log(str.match(reg)); //["test001", "1", index: 4, input: "new test001 test002"]
不同之處就是(d+) 改為了(d)+ ,整個配對結果還是test001 但是第一個分組匹配的結果卻不同。
咱們慢慢來分析他們的區別
(d+) 這整個是一個分組的情況,由於默認情況下匹配模式都是貪婪模式也就是說盡可能多的去匹配
所有d+ 匹配到的結果是001 然後外面添加了一對括號也就是一個分組,這樣第一個分組中匹配的結果就是001.
再來看第二個例子中的(d)+ 同樣這也是一個貪婪模式首先會先匹配0然後後面是0 也會匹配到最後是1 同樣也匹配到到此匹配結束
看起來跟第一個例子中的匹配沒什麼區別,但是這裡的分組(d)表示匹配單個數字,
按照我之前的理解是會匹配最開始匹配到的結果也就是0 但這種理解是錯誤的。由於整個匹配是貪婪模式,盡可能多的去匹配
分組中的(d) 就會捕獲最後一次匹配到的結果1
如果是非貪婪模式那就會盡可能少的去匹配
var reg = /test(\d)+?/; var str = 'new test001 test002'; console.log(str.match(reg)); //["test001", "0", index: 4, input: "new test001 test002"]
這樣(d)匹配結果就是0了,雖然後面還有能夠匹配到的結果,但是這裡是盡可能少的去匹配
非捕獲性分組
var reg = /test(?:\d)+/; var str = 'new test001 test002'; console.log(str.match(reg)); //["test001", index: 4, input: "new test001 test002"]
非捕獲性分組也就是有些地方需要用到一對括號,但是又不想讓他成為一個捕獲性分組也就是不想讓這個分組被類似macth exec 這樣的函數所獲取到
通常在括號內部的前面加上?: 也就是(?: pattern)這樣就變成了一個非捕獲性分組,
這樣match的結果中就不會出現分組匹配到的內容了也就是少了第二項的1.
這篇文章著重說明(d+)和(d)+的差別,也是我今天踩到的坑,若有錯誤之處,歡迎指正。
更多javascript正規表示式中分組詳解相關文章請關注PHP中文網!