首頁  >  文章  >  web前端  >  如何使用正規來查找lookaround

如何使用正規來查找lookaround

php中世界最好的语言
php中世界最好的语言原創
2018-03-30 09:21:151220瀏覽

這次為大家帶來如何使用正規則來查找lookaround,使用正則來查找lookaround的注意事項有哪些,下面就是實戰案例,一起來看一下。

本文實例講述了正規表示式教學之前後查找lookaround。分享給大家供大家參考,具體如下:

註:在所有例子中正規表示式匹配結果包含在源文本中的之間,有的例子會使用Java來實現,如果是java本身正規表示式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、問題引入

在HTML頁面中,符合一對標籤之間的文本,如同符合頁面的標籤,即< title>與之間的文字:

文字:welcome to my page

#正規表示式:<[Tt][Ii][Tt][Ll][Ee]>.*?

結果:welcome to my page

分析:<[Tt][Ii][Tt][Ll][Ee]>表示不區分大小寫,這個模式匹配到了title標籤以及它們之間的文本,但是並不完美,因為我們只想要title標籤之間的文本,而不包括標籤本身。解決這個問題我們就需要用到前後查找(lookaround)。

二、向前尋找

向前尋找指定了一個必須符合但不在結果中傳回的模式。向前查找其實就是一個子表達式,它以?=開頭,需要匹配的文字跟在=的後面。

看一個符合出一個URL位址中協定部分的範例:

文字:http://blog.csdn.net/mhmyqn

正規表示式:.+(?=:)

結果:【http】://blog.csdn.net/mhmyqn

分析:URL位址中協議部分是在:之前的部分,模式.+匹配任意文本,子表達式(?=:)匹配:,但是被匹配到的:並沒有出現在結果中。我們使用?=向正規表示式引擎表明,只要找到:就行了,但不包括在最終的返回結果裡。這裡如果不使用向前匹配(?=:),而是直接使用(:),那麼匹配結果就會是http:了,它包括了:,並不是我們想要的。

注意:前後查找中的前、後是指模式與被查找文本的相對位置而言的,左為前,右為後。即向前查找為:xxx(?=xxx),而向後查找為(?<=xxx)xxx,向後查找在接下來會介紹到。

三、向後找出

向後找出運算子是?<=。但是並不是所有的正規表示式實作都支援向後查找,JavaScript就不支持,java語言支援向後查找。

例如要找出文字當中的價格(以$開頭,後面跟著數字),結果不包含貨幣符號:

文字:category1:$136.25,category2:$28,category3: $88.60

正規表示式:(?<=\$)\d+(\.\d+)?

結果:category1: $【136.25】,category2:$【28】,category3:$【88.60】

#分析:(?< ;=\$)模式符合$,\d+(\.\d+)?模式符合整數或小數。從結果可以看出,結果不包括貨幣符號,只匹配出了價格。如果不使用向後查找,情況會是什麼樣子呢?使用模式$\d+(\.\d+)?,這樣會把$包含在結果中。使用模式\d+(\.\d+)?,又會把categery1(23)中的數字也配對出來,都不是我們想要的。

注意:向前找出模式的長度是可變的,它們可以包含.、*、+之類的元字元;而向後尋找模式只能是固定長度,不能包含.、*、+之類的元字元。

四、把向前查找和向後查找結合起來

#把向前查找和向後查找結合起來使用,即可解決前面HTML標籤之間的文字的問題:

文字:welcome to my page

正規表示式:(?<=<[Tt][Ii][Tt][Ll][Ee]>).*?(?=)

結果:<span style="color: #ff6600">【welcome to my page】</span>< /title></head></span></p> <p style="text-align: left;">分析:從結果可以看出,問題完美的解決了。 (?<=<[Tt][Ii][Tt][Ll][Ee]>)是向後操作,它符合<title>但不消費它,(?=</[Tt ][Ii][Tt][Ll][Ee]>)是一個向前操作,它匹配但不消費它。最終傳回的符合結果只包含了標籤之間的文字了。

五、對前後查找取非

前面說到的向前查找和向後查找通常都是用來匹配文本,其目的是為了確定將被傳回的符合結果的文字的位置(透過指定比對結果的前後必須是哪些文字)。這種用法叫正向前查找和正向後查找。還有一種負向前查找和負向後查找,是查找那些不與給定模式相符的文字。

前後尋找的運算子:

(?=) #正向前尋找
(?!) 負向前找到
(?<=) 正向後找出
(? 為負向後找出

##例如一段文字中即有價格(以$開頭,後面跟數字)和數量,我們要找出價格和數量,先來看找價格:

文字:I paid $30 for 10 apples , 15 oranges, and 10 pears. I saved $5 onthis order.正規表示式:

(?<=\$)\d+

結果:

I paid

【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 【$5】

on thisorder.

#找出數量:文字:

I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正規表示式:

\b(?

#結果:

I paid $30 for

【10】 apples, 【15】
oranges, and

【10】

pears. I saved $5 on this order.

##### ####相信看了本文案例你已經掌握了方法,更多精彩請關注php中文網其它相關文章! ######推薦閱讀:#########正規表示式教學的位置比對教學(附程式碼)###############用php與js實現正規符合數字和字母組合的密碼#########

以上是如何使用正規來查找lookaround的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn