這次帶給大家js裡如何正確理解正規表示式的回溯,js裡正確使用正規表示式回溯的注意事項有哪些,以下就是實戰案例,一起來看一下。
在正規表示式實作中,回溯是匹配過程的基本組成部分,它是正規表示式如此好用且強大的根源。然而,回溯計算代價很高,如果設計失誤,將導致失控。回溯是影響整體效能的唯一因素,理解它的工作原理,以及如何減少使用頻率,可能是編寫高效正則表達式的關鍵點
當一個正則表達式掃描目標字串時,從左到右逐一掃描正規表示式的組成部分,在每個位置上測試能不能找到一個匹配。對於每一個量詞和分支,都必須決定如何繼續進行。如果是量詞(如*、+?或{2,}),那麼正規表示式必須確定何時嘗試匹配更多的字元;如果遇到分支(透過|運算子),那麼正規表示式必須從這些選項中選擇一個進行嘗試。
當正規表示式做出這樣的決定時,如果有必要,它會記住另一個選項,以便在返回後使用。如果所選方案匹配成功,正規表示式將繼續掃描正規表示式模板,如果其餘部分匹配也成功了,那麼匹配就結束了。但是,如果所選的方案未能發現相應匹配,或者後來的匹配也失敗了,正則表達式將回溯到最後一個決策點,然後在剩餘的選項中選擇一個。繼續這樣,直到找到一個匹配,或者量詞和分支選項的所有可能的排列組合都嘗試失敗後放棄這一過程,然後移動到此過程開始位置的下一個字符上,重複此過程。
例如,下面的程式碼示範了這個過程是如何透過回溯處理分支的。
/h(ello|appy) hippo/.test("hello there, happy hippo");
上面一行正規表示式用來符合「hello hippo
」或「happy hippo
」。測試一開始要找一個h,目標字串的第一個字母剛好就是h,立刻就找到了。接下來,子表達式(ello|appy)提供了兩個處理選項。正規表示式選擇最左邊的選項(分支選擇總是從左到右進行),檢查ello 是否匹配字串的下一個字符,確實匹配,然後正則表達式又匹配了後面的空格。
然而,在接下來的匹配中正則表達式“走進了死胡同”,因為hippo 中的h 不能匹配字串中的下一個字母t。此時正則表達式還不能放棄,因為它還沒有嘗試過所有的選擇,隨後它回溯到最後一個檢查點(在匹配了首字母h 之後的那個位置上)並嘗試匹配第二個分支選項。但由於匹配沒有成功,而且也沒有更多的選項了,正則表達式認為從字串的第一個字元開始匹配是不能成功的,因此它從第二個字元開始重新進行查找。正規表示式沒有找到h,繼續向後找,直到第14 個字母才找到,它符合happy 的那個h。隨後正規表示式再次進入分支過程,這次ello 未能匹配,但在回溯之後的第二次分支中,它匹配了整個字串“happy hippo”,匹配成功了。
再如,下面程式碼示範了重複量詞的回溯。
var str = "<p>Para 1.</p>" +"<img alt="js裡如何正確理解正規表示式的回溯" >" +"<p>Para 2.</p>" +"<p>p.</p>"; /<p>.*/i.test(str);</p>
正規表示式先符合了字串開始的3個字母
,然後是.*。點號表示匹配換行符以外的任意字符,星號這個「貪婪」量詞表示重複零次或多次,匹配盡量多的次數。因為目標字串中沒有換行符,正規表示式將匹配剩餘的全部字串!不過由於正規表示式範本還有更多內容需要匹配,所以正規表示式嘗試匹配標籤的。匹配返回成功需要從第一段頭部一直掃描到最後一個的末尾,這可能不是我們想要的結果。
將正規表示式中的「貪婪」量詞*改為「懶惰」(又稱「非貪婪」)量詞*?,以符合單一段落。 「懶惰」量詞的回溯工作以相反方式進行。當正規表示式/
.*?/推進到.*?時,首先嘗試全部跳過,然後繼續匹配。
这样做是因为*?匹配零次或多次,尽可能少重复,尽可能少意味着可以重复零次。但是,当随后的得到完全匹配。
如果目标字符串只有一个段落,那么此正则表达式的“贪婪”版本和“懒惰”版本是等价的,但尝试匹配的过程不同。
当一个正则表达式占用浏览器几秒甚至更长时间时,问题原因很可能是回溯失控。为说明此问题,给出下面的正则表达式,它的目标是匹配整个HTML文件。此表达式被拆分成多行是为了适合页面显示。与其他正则表达式不同,JavaScript在没有选项时可使点号匹配任意字符,包括换行符,所以此例中以[\s\S]匹配任意字符。
/[\s\S]*?[\s\S]*?<title>[\s\S]*?[\s\S]*? [\s\S]*?</title>[\s\S]*?[\s\S]*?/
此正则表达式匹配在正常HTML 字符串时工作良好,但当目标字符串缺少一个或多个标签时,就会变得十分糟糕。例如标签缺失,最后一个[\s\S]*?将扩展到字符串的末尾,因为在那里没有发现标签,然后正则表达式将查看此前的[\s\S]*?队列记录的回溯位置,使它们进一步扩大。正则表达式尝试扩展倒数第二个[\s\S]*?—用它匹配标签,就是此前匹配过正则表达式模板的那个标签,然后继续查找第二个
以上是js裡如何正確理解正規表示式的回溯的詳細內容。更多資訊請關注PHP中文網其他相關文章!

JavaScript在現實世界中的應用包括服務器端編程、移動應用開發和物聯網控制:1.通過Node.js實現服務器端編程,適用於高並發請求處理。 2.通過ReactNative進行移動應用開發,支持跨平台部署。 3.通過Johnny-Five庫用於物聯網設備控制,適用於硬件交互。

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序(一個Edtech應用程序),您可以做同樣的事情。 首先,什麼是多租戶SaaS應用程序? 多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務

本文展示了與許可證確保的後端的前端集成,並使用Next.js構建功能性Edtech SaaS應用程序。 前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

JavaScript是現代Web開發的核心語言,因其多樣性和靈活性而廣泛應用。 1)前端開發:通過DOM操作和現代框架(如React、Vue.js、Angular)構建動態網頁和單頁面應用。 2)服務器端開發:Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發:通過ReactNative和Electron實現跨平台開發,提高開發效率。

JavaScript的最新趨勢包括TypeScript的崛起、現代框架和庫的流行以及WebAssembly的應用。未來前景涵蓋更強大的類型系統、服務器端JavaScript的發展、人工智能和機器學習的擴展以及物聯網和邊緣計算的潛力。

JavaScript是現代Web開發的基石,它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發,極大地提升了用戶體驗和跨平台開發的靈活性。

Python更适合数据科学和机器学习,JavaScript更适合前端和全栈开发。1.Python以简洁语法和丰富库生态著称,适用于数据分析和Web开发。2.JavaScript是前端开发核心,Node.js支持服务器端编程,适用于全栈开发。

JavaScript不需要安裝,因為它已內置於現代瀏覽器中。你只需文本編輯器和瀏覽器即可開始使用。 1)在瀏覽器環境中,通過標籤嵌入HTML文件中運行。 2)在Node.js環境中,下載並安裝Node.js後,通過命令行運行JavaScript文件。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Dreamweaver CS6
視覺化網頁開發工具

WebStorm Mac版
好用的JavaScript開發工具