測試資料:
例如上面這幾個簡單的日誌條目,我們想實現兩個目標:
1、把8號的資料過濾掉;
2、把那些不包含robots.txt字串的條目給找出來(只要Url包含robots.txt的都給過濾掉)。
前瞻的語法是:
(?!匹配模式)
我們先來實現第一個目標-符合不以特定字串開頭的條目。
這裡我們因為要排除一段連續的字串,因此符合模式非常簡單,就是2009-07-08。實作如下:
^(?!2009-07-08).*?$
用Expresso我們可以看到結果確實過濾掉8號的資料。
接下來,我們來實現第二個目標-排除包含特定字串的條目。
按照我們上面寫法,我照葫蘆畫瓢了一下:
^.*?(?!robots\.txt).*?$
這段正則用大白話描述就是:開頭任意字符,然後後面不要跟著robots.txt連續字符串,然後再跟著任意個字符,字串結尾。
執行測試,結果發現:
沒有達到我們想要的效果。這是為什麼呢?我們為上面的正規表示式加上兩個捕獲分組調試:
^(.*?)(?!robots\.txt)(.*?)$
測試結果:
我們看到,第一個分組啥都沒有匹配到,而第二個分組卻匹配了整個字串。再回過頭來好好分析剛才那個正規表示式。
實際上,當正規引擎解析到A區 域的時候,就已經開始執行B區域的前瞻工作。這個時候發現當A區域為Null的時候匹配成功——.*本來就允許匹配空字符,前瞻條件又滿足,A區域後面緊 跟著的是“2009”字符串,而並不是robots。因此整個匹配過程成功地匹配到所有條目。
分析出原因之後我們對上述的正規進行修正,將.*?移入前瞻表達式,如下:
^(?!.*?robots).*$
測試結果:
推薦教學:java開發入門
#以上是java使用正規表示式來匹配不包含某個規則的字串的詳細內容。更多資訊請關注PHP中文網其他相關文章!