本文實例講述了正規表示式教學之前後查找lookaround。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達式匹配結果包含在源文本中的【和】之間,有的例子會使用Java來實現,如果是java本身正則表達式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
一、問題引入
在HTML頁面中,匹配一對標籤之間的文本,如匹配出頁面的標籤,即
文本:
正規表示式:.*? [Tt][Ii] [Tt][Ll][Ee]>
結果:
【分析:表示不區分大小寫,這個模式匹配到了title標籤以及它們之間的文本,但是並不完美,因為我們只想要title標籤之間的文本,而不包括標籤本身。解決這個問題我們就需要用到前後查找(lookaround)。
二、向前查找
向前查找指定了一個必須匹配但不在結果中返回的模式。向前查找其實就是一個子表達式,它以?=開頭,需要匹配的文字跟在=的後面。
看一個符合出一個URL位址中協定部分的範例:
文字:http://blog.csdn.net/mhmyqn
正規表示式:.+(?=:)
結果:【http】 ://blog.csdn.net/mhmyqn
分析:URL位址中協議部分是在:之前的部分,模式.+匹配任意文本,子表達式(?=:)匹配:,但是被匹配到的:並沒有出現在結果中。我們使用?=向正規表示式引擎表明,只要找到:就行了,但不包括在最終的返回結果裡。這裡如果不使用向前匹配(?=:),而是直接使用(:),那麼匹配結果就會是http:了,它包括了:,並不是我們想要的。
注意:前後查找中的前、後是指模式與被查找文本的相對位置而言的,左為前,右為後。即向前查找為:xxx(?=xxx),而向後查找為(?
三、向後查找
向後查找操作符是?
例如要找出文本當中的價格(以$開頭,後面跟數字),結果不包含貨幣符號:
文本:category1:$136.25,category2:$28,category3:$88.60
正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式: $)d+(.d+)?
結果:category1:$【136.25】,category2:$【28】,category3:$【88.60】
分析:(?
注意:向前查找模式的長度是可變的,它們可以包含.、*、+之類的元字符;而向後查找模式只能是固定長度,不能包含.、*、+之類的元字元。
四、把向前查找和向後查找結合起來
把向前查找和向後查找結合起來使用,即可解決前面HTML標籤之間的文本的問題:
文本:
正規表示式:(?).*?(?= [ Tt][Ii][Tt][Ll][Ee]>)
結果:
分析:從結果可以看出,問題完美的解決了。 (?)是向後操作,它符合
五、對前後查找取非
前面說到的向前查找和向後查找通常都是用來匹配文本,其目的是為了確定將被返回的匹配結果的文本的位置(通過指定匹配結果的前後必須是哪些文本)。這種用法叫正向前查找和正向後查找。還有一種負向前查找和負向後查找,是查找那些不與給定模式相符的文字。
前後查找的操作符:
例如一段文字中即有價格(以$開頭,後面跟數字)和數量,我們要找出價格和數量,先來看查找價格:
文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.
正則表達式:(?
結果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved
查找數量:文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.正則表達式:b(? pI$30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.
分析:(?
六、小結
有了前後查找,就可以對最終的匹配結果包含哪些內容做出精確的控制。前後查找操作使我們可以利用子表達式來指定文字匹配操作發生的位置,並收到只匹配不消費的效果。
希望本文所述對大家正規表示式學習有所幫助。
更多正規表示式教學之前後查找lookaround詳解相關文章請關注PHP中文網!

PHP日誌記錄對於監視和調試Web應用程序以及捕獲關鍵事件,錯誤和運行時行為至關重要。它為系統性能提供了寶貴的見解,有助於識別問題並支持更快的故障排除

Laravel使用其直觀的閃存方法簡化了處理臨時會話數據。這非常適合在您的應用程序中顯示簡短的消息,警報或通知。 默認情況下,數據僅針對後續請求: $請求 -

PHP客戶端URL(curl)擴展是開發人員的強大工具,可以與遠程服務器和REST API無縫交互。通過利用Libcurl(備受尊敬的多協議文件傳輸庫),PHP curl促進了有效的執行

Laravel 提供简洁的 HTTP 响应模拟语法,简化了 HTTP 交互测试。这种方法显著减少了代码冗余,同时使您的测试模拟更直观。 基本实现提供了多种响应类型快捷方式: use Illuminate\Support\Facades\Http; Http::fake([ 'google.com' => 'Hello World', 'github.com' => ['foo' => 'bar'], 'forge.laravel.com' =>

您是否想為客戶最緊迫的問題提供實時的即時解決方案? 實時聊天使您可以與客戶進行實時對話,並立即解決他們的問題。它允許您為您的自定義提供更快的服務

文章討論了PHP 5.3中介紹的PHP中的晚期靜態結合(LSB),允許靜態方法的運行時間分辨率調用以更靈活的繼承。 LSB的實用應用和潛在的觸摸


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Dreamweaver CS6
視覺化網頁開發工具

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。