搜尋
首頁後端開發php教程正規表示式教學之前後再查找lookaround詳解

本文實例講述了正規表示式教學之前後查找lookaround。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達式匹配結果包含在源文本中的【和】之間,有的例子會使用Java來實現,如果是java本身正則表達式的用法,會在對應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、問題引入

在HTML頁面中,匹配一對標籤之間的文本,如匹配出頁面的標籤,即

之間的文本:

文本:

welcome to my page

正規表示式:.*? [Tt][Ii] [Tt][Ll][Ee]>

結果:

welcome to my page

分析:表示不區分大小寫,這個模式匹配到了title標籤以及它們之間的文本,但是並不完美,因為我們只想要title標籤之間的文本,而不包括標籤本身。解決這個問題我們就需要用到前後查找(lookaround)。

二、向前查找

向前查找指定了一個必須匹配但不在結果中返回的模式。向前查找其實就是一個子表達式,它以?=開頭,需要匹配的文字跟在=的後面。

看一個符合出一個URL位址中協定部分的範例:

文字:http://blog.csdn.net/mhmyqn

正規表示式:.+(?=:)

結果:【http】 ://blog.csdn.net/mhmyqn

分析:URL位址中協議部分是在:之前的部分,模式.+匹配任意文本,子表達式(?=:)匹配:,但是被匹配到的:並沒有出現在結果中。我們使用?=向正規表示式引擎表明,只要找到:就行了,但不包括在最終的返回結果裡。這裡如果不使用向前匹配(?=:),而是直接使用(:),那麼匹配結果就會是http:了,它包括了:,並不是我們想要的。

注意:前後查找中的前、後是指模式與被查找文本的相對位置而言的,左為前,右為後。即向前查找為:xxx(?=xxx),而向後查找為(?

三、向後查找

向後查找操作符是?

例如要找出文本當中的價格(以$開頭,後面跟數字),結果不包含貨幣符號:

文本:category1:$136.25,category2:$28,category3:$88.60

正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式:(正則表達式: $)d+(.d+)?

結果:category1:$【136.25】,category2:$【28】,category3:$【88.60】

分析:(?

注意:向前查找模式的長度是可變的,它們可以包含.、*、+之類的元字符;而向後查找模式只能是固定長度,不能包含.、*、+之類的元字元。

四、把向前查找和向後查找結合起來

把向前查找和向後查找結合起來使用,即可解決前面HTML標籤之間的文本的問題:

文本:

welcome to my page

正規表示式:(?).*?(?= [ Tt][Ii][Tt][Ll][Ee]>)

結果:

【welcome to my page】

分析:從結果可以看出,問題完美的解決了。 (?)是向後操作,它符合

但不消費它,(?=[Tt][Ii][ Tt][Ll][Ee]>)是一個向前操作,它匹配但不消費它。最終傳回的符合結果只包含了標籤之間的文字了。

五、對前後查找取非

前面說到的向前查找和向後查找通常都是用來匹配文本,其目的是為了確定將被返回的匹配結果的文本的位置(通過指定匹配結果的前後必須是哪些文本)。這種用法叫正向前查找和正向後查找。還有一種負向前查找和負向後查找,是查找那些不與給定模式相符的文字。

前後查找的操作符:

正規表示式教學之前後再查找lookaround詳解

例如一段文字中即有價格(以$開頭,後面跟數字)和數量,我們要找出價格和數量,先來看查找價格:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達式:(?

結果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 

查找數量:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達式:b(? pI

$30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.

分析:(?

六、小結

有了前後查找,就可以對最終的匹配結果包含哪些內容做出精確的控制。前後查找操作使我們可以利用子表達式來指定文字匹配操作發生的位置,並收到只匹配不消費的效果。

希望本文所述對大家正規表示式學習有所幫助。

更多正規表示式教學之前後查找lookaround詳解相關文章請關注PHP中文網!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
可以在PHP會話中存儲哪些數據?可以在PHP會話中存儲哪些數據?May 02, 2025 am 12:17 AM

phpsessionscanStorestrings,數字,數組和原始物。

您如何開始PHP會話?您如何開始PHP會話?May 02, 2025 am 12:16 AM

tostartaphpsession,usesesses_start()attheScript'Sbeginning.1)placeitbeforeanyOutputtosetThesessionCookie.2)useSessionsforuserDatalikeloginstatusorshoppingcarts.3)regenerateSessiveIdStopreventFentfixationAttacks.s.4)考慮使用AttActAcks.s.s.4)

什麼是會話再生,如何提高安全性?什麼是會話再生,如何提高安全性?May 02, 2025 am 12:15 AM

會話再生是指在用戶進行敏感操作時生成新會話ID並使舊ID失效,以防會話固定攻擊。實現步驟包括:1.檢測敏感操作,2.生成新會話ID,3.銷毀舊會話ID,4.更新用戶端會話信息。

使用PHP會話時有哪些性能考慮?使用PHP會話時有哪些性能考慮?May 02, 2025 am 12:11 AM

PHP会话对应用性能有显著影响。优化方法包括:1.使用数据库存储会话数据,提升响应速度;2.减少会话数据使用,只存储必要信息;3.采用非阻塞会话处理器,提高并发能力;4.调整会话过期时间,平衡用户体验和服务器负担;5.使用持久会话,减少数据读写次数。

PHP會話與Cookie有何不同?PHP會話與Cookie有何不同?May 02, 2025 am 12:03 AM

PHPsessionsareserver-side,whilecookiesareclient-side.1)Sessionsstoredataontheserver,aremoresecure,andhandlelargerdata.2)Cookiesstoredataontheclient,arelesssecure,andlimitedinsize.Usesessionsforsensitivedataandcookiesfornon-sensitive,client-sidedata.

PHP如何識別用戶的會話?PHP如何識別用戶的會話?May 01, 2025 am 12:23 AM

phpIdentifiesauser'ssessionSessionSessionCookiesAndSessionId.1)whiwsession_start()被稱為,phpgeneratesainiquesesesessionIdStoredInacookInAcookInAcienamedInAcienamedphpsessIdontheuser'sbrowser'sbrowser.2)thisIdallowSphptpptpptpptpptpptpptpptoretoreteretrieetrieetrieetrieetrieetrieetreetrieetrieetrieetrieetremthafromtheserver。

確保PHP會議的一些最佳實踐是什麼?確保PHP會議的一些最佳實踐是什麼?May 01, 2025 am 12:22 AM

PHP會話的安全可以通過以下措施實現:1.使用session_regenerate_id()在用戶登錄或重要操作時重新生成會話ID。 2.通過HTTPS協議加密傳輸會話ID。 3.使用session_save_path()指定安全目錄存儲會話數據,並正確設置權限。

PHP會話文件默認存儲在哪裡?PHP會話文件默認存儲在哪裡?May 01, 2025 am 12:15 AM

phpsessionFilesArestoredIntheDirectorySpecifiedBysession.save_path,通常是/tmponunix-likesystemsorc:\ windows \ windows \ temponwindows.tocustomizethis:tocustomizEthis:1)useession_save_save_save_path_path()

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器