js裡如何正確理解正規表示式的回溯-js教程-PHP中文網

首頁

web前端

js教程

js裡如何正確理解正規表示式的回溯

php中世界最好的语言

Mar 30, 2018 pm 01:56 PM

javascript表達式

這次帶給大家js裡如何正確理解正規表示式的回溯，js裡正確使用正規表示式回溯的注意事項有哪些，以下就是實戰案例，一起來看一下。

在正規表示式實作中，回溯是匹配過程的基本組成部分，它是正規表示式如此好用且強大的根源。然而，回溯計算代價很高，如果設計失誤，將導致失控。回溯是影響整體效能的唯一因素，理解它的工作原理，以及如何減少使用頻率，可能是編寫高效正則表達式的關鍵點

當一個正則表達式掃描目標字串時，從左到右逐一掃描正規表示式的組成部分，在每個位置上測試能不能找到一個匹配。對於每一個量詞和分支，都必須決定如何繼續進行。如果是量詞（如*、+?或{2,}），那麼正規表示式必須確定何時嘗試匹配更多的字元；如果遇到分支（透過|運算子），那麼正規表示式必須從這些選項中選擇一個進行嘗試。

當正規表示式做出這樣的決定時，如果有必要，它會記住另一個選項，以便在返回後使用。如果所選方案匹配成功，正規表示式將繼續掃描正規表示式模板，如果其餘部分匹配也成功了，那麼匹配就結束了。但是，如果所選的方案未能發現相應匹配，或者後來的匹配也失敗了，正則表達式將回溯到最後一個決策點，然後在剩餘的選項中選擇一個。繼續這樣，直到找到一個匹配，或者量詞和分支選項的所有可能的排列組合都嘗試失敗後放棄這一過程，然後移動到此過程開始位置的下一個字符上，重複此過程。

例如，下面的程式碼示範了這個過程是如何透過回溯處理分支的。

/h(ello|appy) hippo/.test("hello there, happy hippo");

上面一行正規表示式用來符合「hello hippo」或「happy hippo」。測試一開始要找一個h，目標字串的第一個字母剛好就是h，立刻就找到了。接下來，子表達式（ello|appy）提供了兩個處理選項。正規表示式選擇最左邊的選項（分支選擇總是從左到右進行），檢查ello 是否匹配字串的下一個字符，確實匹配，然後正則表達式又匹配了後面的空格。

然而，在接下來的匹配中正則表達式“走進了死胡同”，因為hippo 中的h 不能匹配字串中的下一個字母t。此時正則表達式還不能放棄，因為它還沒有嘗試過所有的選擇，隨後它回溯到最後一個檢查點（在匹配了首字母h 之後的那個位置上）並嘗試匹配第二個分支選項。但由於匹配沒有成功，而且也沒有更多的選項了，正則表達式認為從字串的第一個字元開始匹配是不能成功的，因此它從第二個字元開始重新進行查找。正規表示式沒有找到h，繼續向後找，直到第14 個字母才找到，它符合happy 的那個h。隨後正規表示式再次進入分支過程，這次ello 未能匹配，但在回溯之後的第二次分支中，它匹配了整個字串“happy hippo”，匹配成功了。

再如，下面程式碼示範了重複量詞的回溯。

var str = "<p>Para 1.</p>" +"<img  alt="js裡如何正確理解正規表示式的回溯" >" +"<p>Para 2.</p>" +"<p>p.</p>";
/<p>.*/i.test(str);</p>

正規表示式先符合了字串開始的3個字母

，然後是.*。點號表示匹配換行符以外的任意字符，星號這個「貪婪」量詞表示重複零次或多次，匹配盡量多的次數。因為目標字串中沒有換行符，正規表示式將匹配剩餘的全部字串！不過由於正規表示式範本還有更多內容需要匹配，所以正規表示式嘗試匹配標籤的。匹配返回成功需要從第一段頭部一直掃描到最後一個的末尾，這可能不是我們想要的結果。

將正規表示式中的「貪婪」量詞*改為「懶惰」（又稱「非貪婪」）量詞*?，以符合單一段落。「懶惰」量詞的回溯工作以相反方式進行。當正規表示式/

.*?/推進到.*?時，首先嘗試全部跳過，然後繼續匹配。

这样做是因为*?匹配零次或多次，尽可能少重复，尽可能少意味着可以重复零次。但是，当随后的得到完全匹配。

如果目标字符串只有一个段落，那么此正则表达式的“贪婪”版本和“懒惰”版本是等价的，但尝试匹配的过程不同。

当一个正则表达式占用浏览器几秒甚至更长时间时，问题原因很可能是回溯失控。为说明此问题，给出下面的正则表达式，它的目标是匹配整个HTML文件。此表达式被拆分成多行是为了适合页面显示。与其他正则表达式不同，JavaScript在没有选项时可使点号匹配任意字符，包括换行符，所以此例中以[\s\S]匹配任意字符。

/[\s\S]*?[\s\S]*?<title>[\s\S]*?[\s\S]*?
[\s\S]*?</title>[\s\S]*?[\s\S]*?/

此正则表达式匹配在正常HTML 字符串时工作良好，但当目标字符串缺少一个或多个标签时，就会变得十分糟糕。例如标签缺失，最后一个[\s\S]*?将扩展到字符串的末尾，因为在那里没有发现标签，然后正则表达式将查看此前的[\s\S]*?队列记录的回溯位置，使它们进一步扩大。正则表达式尝试扩展倒数第二个[\s\S]*?—用它匹配标签，就是此前匹配过正则表达式模板的那个标签，然后继续查找第二个

以上是js裡如何正確理解正規表示式的回溯的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

超越瀏覽器：現實世界中的JavaScriptApr 12, 2025 am 12:06 AM

JavaScript在現實世界中的應用包括服務器端編程、移動應用開發和物聯網控制：1.通過Node.js實現服務器端編程，適用於高並發請求處理。 2.通過ReactNative進行移動應用開發，支持跨平台部署。 3.通過Johnny-Five庫用於物聯網設備控制，適用於硬件交互。

使用Next.js（後端集成）構建多租戶SaaS應用程序Apr 11, 2025 am 08:23 AM

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序（一個Edtech應用程序），您可以做同樣的事情。首先，什麼是多租戶SaaS應用程序？多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務

如何使用Next.js（前端集成）構建多租戶SaaS應用程序Apr 11, 2025 am 08:22 AM

本文展示了與許可證確保的後端的前端集成，並使用Next.js構建功能性Edtech SaaS應用程序。前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

JavaScript：探索網絡語言的多功能性Apr 11, 2025 am 12:01 AM

JavaScript是現代Web開發的核心語言，因其多樣性和靈活性而廣泛應用。 1)前端開發：通過DOM操作和現代框架（如React、Vue.js、Angular）構建動態網頁和單頁面應用。 2)服務器端開發：Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發：通過ReactNative和Electron實現跨平台開發，提高開發效率。

JavaScript的演變：當前的趨勢和未來前景Apr 10, 2025 am 09:33 AM

JavaScript的最新趨勢包括TypeScript的崛起、現代框架和庫的流行以及WebAssembly的應用。未來前景涵蓋更強大的類型系統、服務器端JavaScript的發展、人工智能和機器學習的擴展以及物聯網和邊緣計算的潛力。

神秘的JavaScript：它的作用以及為什麼重要Apr 09, 2025 am 12:07 AM

JavaScript是現代Web開發的基石，它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發，極大地提升了用戶體驗和跨平台開發的靈活性。