搜尋
首頁web前端js教程在PHP使用正規的效率 貪婪、非貪婪與回溯詳解(附代碼)

這次帶給大家在PHP裡使用正規的效率貪婪、非貪婪與回溯詳解(附程式碼),在PHP裡使用正規的效率貪婪、非貪婪與回溯的注意事項有哪些,下面就是實戰案例,一起來看一下。

先掃盲什麼是正規表示式的貪婪,什麼是非貪婪?或說什麼是匹配優先量詞,什麼是忽略優先量詞?

好吧,我也不知道概念是什麼,來舉例。

某同學想過濾之間的內容,那是這麼寫正規以及程式的。

$str = preg_replace('%<script>.+?</script>%i','',$str);//非贪婪

看起來,好像沒什麼問題,其實不然。若

$str = '<script>alert(document.cookie)</script>>alert(document.cookie)';

那麼經過上面的程式處理,其結果為

$str = '<script>alert(document.cookie)</script>>alert(document.cookie)'; 
$str = preg_replace('%<script>.+?</script>%i','',$str);//非贪婪 
print_r($str); 
//$str 输出为 <script>alert(document.cookie)</script>

仍然達不到他想要的效果。上面的就是非貪婪,也有的叫惰性。其標誌非貪婪的標識為量數元字元後面加? ,例如 +?、*?、??(比較特殊,以後的BLOG中,我會寫到)等。即標識非貪婪,如果不寫?就是貪婪。例如

$str = '<script>alert(document.cookie)</script>>alert(document.cookie)'; 
$str = preg_replace('%<script>.+</script>%i','',$str);//非贪婪 
print_r($str); 
//$str 输出为 <script><p style="text-align: left;">以上為貪婪,非貪婪的區別介紹。下面,聊下貪婪、非貪婪引起的回溯問題。先看個小例子。 <p style="text-align: left;">正規表示式為\w*(\d+),<a href="http://www.php.cn/wiki/57.html" target="_blank">字串為cfc456n,那麼,這個正規則符合的$1是多少? ? <p style="text-align: left;">如果您回答是 456,那麼,恭喜你,回答錯了,其結果不是456,而是6,您知道為什麼嗎? <p style="text-align: left;">CFC4N來解釋一下,當正則引擎用正則\w*(\d+)去匹配字串cfc456n時,會先用\w*去匹配字串cfc456n,首先,\w*會匹配字符串cfc456n的所有字符,然後再交給\d+去匹配剩下的字符串,而剩下的沒了,這時,\w*規則會不情願的吐出一個字符,給\d+去匹配,同時,在吐出字符之前,記錄一個點,這個點,就是用於回溯的點,然後\d+去匹配n,發現並不能匹配成功,會再次要求\w*再吐出一個字符,\w*會先再次記錄一個回溯的點,再吐出一個字元。這時,\w* 匹配的結果只有cfc45了,已經吐出6n了,\d+再去匹配6,發現匹配成功,則會通知引擎,匹配成功了,就直接顯示出來了。所以,(\d+)的結果是6,而不是456。 <p style="text-align: left;">當上面的正規表示式改為 \w*?(\d+)(注意,此處為非貪婪),字串仍然為cfc456n,那麼,這時候,正則匹配的$1是多少? ? <p style="text-align: left;">甲同學回答:結果是 456。 <p style="text-align: left;">嗯,是的,正確,是456,CFC4N弱弱的問下,為什麼是456 呢? <p style="text-align: left;">我在來解釋為什麼是456<p style="text-align: left;">正規表示式有條規則,是量詞優先匹配,所以\w*?會先去匹配字串cfc456,由於\w*?是非貪婪,正則引擎會用表達式\w+?每次僅匹配一個字符串,然後再將控制權交給後面的\d+去匹配下一個字符,同時,記錄一個點,用於在匹配不成功的時候,返回這裡,再次匹配,也就是回溯點。由於\w後面是量詞是*,*表示0到無數次,所以,首先是0次,也就是\w*?匹配個空,記錄回溯點,將控制權交給\d+,\d+去匹配cfc456n的第一個字元c,然後,匹配失敗,於是乎,接著講控制權交給\w*?去匹配cfc456n的c,\w*?匹配c成功,由於是非貪婪,所以,他每次只匹配一個字符,記錄回溯點,然後再將控制權交給\d+匹配f,接著,\d+匹配f再失敗,再把控制權給\w*?,\w*?再匹配c,記錄回溯點(這時\w*?匹配結果是cfc了),再把控制權給\d+,\d+去匹配4,匹配成功,然後,由於量詞是+,就是1到無數次,所以,接著往後匹配,再匹配5,成功,再接著,再匹配6,成功,再接著,繼續匹配操作,下一個字符是n,匹配失敗,這時,\d+會吧控制權交出去。由於\d+後面已經沒有正規表示式了,所以,整個正規表示式宣告匹配完成,其結果就是 cfc456, 其中第一組結果是456。親愛的同學,您明白剛剛的題目的結果,為什麼是456了嗎? <p style="text-align: left;">好了,您是否從上面的例子了解了貪婪,非貪婪的匹配原理了?那麼您是否明白您在什麼時候需要使用貪婪,非貪婪去處理您的字串了? <p style="text-align: left;">鳥哥的文章裡講到針對表達式、程式為<pre class="brush:php;toolbar:false">$reg = "/<script>.*?<\/script>/is"; 
$str = "<script>********</script>"; //长度大于100014 
$ret = preg_repalce($reg, "", $str); //返回NULL

原因就是回溯太多了,直到造成耗盡堆疊空間爆棧。

再来看个例子。

字符串

$str = '<script>123456</script>';

正则表达式为

$strRegex1 = '%<script>.+<\/script>%&#39;; 
$strRegex2 = &#39;%<script>.+?<\/script>%&#39;; 
$strRegex3 = &#39;%<script>(?:(?!<\/script>).)+<\/script>%&#39;;</script>

相信看了本文案例你已经掌握了方法,更多精彩请关注php中文网其它相关文章!

推荐阅读:

用正则匹配单个字符的详细解析

正则的位置匹配使用详解

以上是在PHP使用正規的效率 貪婪、非貪婪與回溯詳解(附代碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
JavaScript框架:為現代網絡開發提供動力JavaScript框架:為現代網絡開發提供動力May 02, 2025 am 12:04 AM

JavaScript框架的強大之處在於簡化開發、提升用戶體驗和應用性能。選擇框架時應考慮:1.項目規模和復雜度,2.團隊經驗,3.生態系統和社區支持。

JavaScript,C和瀏覽器之間的關係JavaScript,C和瀏覽器之間的關係May 01, 2025 am 12:06 AM

引言我知道你可能會覺得奇怪,JavaScript、C 和瀏覽器之間到底有什麼關係?它們之間看似毫無關聯,但實際上,它們在現代網絡開發中扮演著非常重要的角色。今天我們就來深入探討一下這三者之間的緊密聯繫。通過這篇文章,你將了解到JavaScript如何在瀏覽器中運行,C 在瀏覽器引擎中的作用,以及它們如何共同推動網頁的渲染和交互。 JavaScript與瀏覽器的關係我們都知道,JavaScript是前端開發的核心語言,它直接在瀏覽器中運行,讓網頁變得生動有趣。你是否曾經想過,為什麼JavaScr

node.js流帶打字稿node.js流帶打字稿Apr 30, 2025 am 08:22 AM

Node.js擅長於高效I/O,這在很大程度上要歸功於流。 流媒體匯總處理數據,避免內存過載 - 大型文件,網絡任務和實時應用程序的理想。將流與打字稿的類型安全結合起來創建POWE

Python vs. JavaScript:性能和效率注意事項Python vs. JavaScript:性能和效率注意事項Apr 30, 2025 am 12:08 AM

Python和JavaScript在性能和效率方面的差異主要體現在:1)Python作為解釋型語言,運行速度較慢,但開發效率高,適合快速原型開發;2)JavaScript在瀏覽器中受限於單線程,但在Node.js中可利用多線程和異步I/O提升性能,兩者在實際項目中各有優勢。

JavaScript的起源:探索其實施語言JavaScript的起源:探索其實施語言Apr 29, 2025 am 12:51 AM

JavaScript起源於1995年,由布蘭登·艾克創造,實現語言為C語言。 1.C語言為JavaScript提供了高性能和系統級編程能力。 2.JavaScript的內存管理和性能優化依賴於C語言。 3.C語言的跨平台特性幫助JavaScript在不同操作系統上高效運行。

幕後:什麼語言能力JavaScript?幕後:什麼語言能力JavaScript?Apr 28, 2025 am 12:01 AM

JavaScript在瀏覽器和Node.js環境中運行,依賴JavaScript引擎解析和執行代碼。 1)解析階段生成抽象語法樹(AST);2)編譯階段將AST轉換為字節碼或機器碼;3)執行階段執行編譯後的代碼。

Python和JavaScript的未來:趨勢和預測Python和JavaScript的未來:趨勢和預測Apr 27, 2025 am 12:21 AM

Python和JavaScript的未來趨勢包括:1.Python將鞏固在科學計算和AI領域的地位,2.JavaScript將推動Web技術發展,3.跨平台開發將成為熱門,4.性能優化將是重點。兩者都將繼續在各自領域擴展應用場景,並在性能上有更多突破。

Python vs. JavaScript:開發環境和工具Python vs. JavaScript:開發環境和工具Apr 26, 2025 am 12:09 AM

Python和JavaScript在開發環境上的選擇都很重要。 1)Python的開發環境包括PyCharm、JupyterNotebook和Anaconda,適合數據科學和快速原型開發。 2)JavaScript的開發環境包括Node.js、VSCode和Webpack,適用於前端和後端開發。根據項目需求選擇合適的工具可以提高開發效率和項目成功率。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境