什么时候会用到递归正则表达式呢? 当然是待匹配的字串中递归地出现某种模式时(貌似废话). 最经典的例子, 就是递归正则处理嵌套括号的问题了.
例子如下.
假设你的文本中包含了正确配对的嵌套括号. 括号的深度可以是无限层. 你想捕获这样的括号组.
恕我剧透, 标准答案是这样的:
代码如下 | 复制代码 |
$string = "some text (a(b(c)d)e) more text"; "; print_r($matches); echo ""; } ?> 其输出结果是:
|
可见, 我们所需要的文本, 已经捕获到$matches[0]中了.
原理
现在思考原理.
上面的正则表达式中的关键点是(?R). (?R)的作用就是递归地替换它所在的整条正则表达式. 在每次迭代时, PHP 语法分析器都会将(?R)替换为”(([^()]+|(?R))*)“.
因此, 具体到上述的例子, 其正则表达式等价于:
代码如下 | 复制代码 |
"/(([^()]+|(([^()]+|(([^()]+)*))*))*)/" |
但是上面的代码只适合深度为3层的括号. 对于未知深度的括号嵌套, 就只好使用这种正则了:
代码如下 | 复制代码 |
"/(([^()]+|(?R))*)/" |
它不但能够匹配无限深度, 还简化了正则表达式的语法. 功能强大, 语法简洁.
现在来细看一下"/(([^()]+|(?R))*)/"是怎样匹配"(a(b(c)d)e)"的:
1."(c)"这部分被正则式 "(([^()]+)*)" 匹配. 请注意, (c) 其实就相当于整个递归的一个缩影, 麻雀虽小五脏俱全, 因此它用到了整个正则表达式.
换言之, 下一步中的(c), 可以使用(?R) 来匹配.
2.(b(c)d)的匹配过程为:
1."("匹配"(";
2."[^()]+"匹配"b";
3. (?R)匹配"(c)";
4."[^()]+"匹配"d";
5.")"匹配")".
根据上面的匹配原理, 不难理解为什么数组的第2个元素$matches[1]与'e'等价. 子串'e'是在最后一次匹配迭代中被捕获. 匹配过程中, 只有最后一次的捕获结果才会保存到数组中.
rex注: 关于这个特性, 可以自行尝试一下, 看看使用正则式([a-z]+[0-9]+)+来匹配字串abc123xyz890, 其捕获结果$1是什么. 注意, 其结果与 Left Longest 原理并不冲突.
如果我们只需要捕获 $matches[0], 可以这样做:
代码如下 | 复制代码 |
$string = "some text (a(b(c)d)e) more text"; "; print_r($matches); echo ""; } ?> 产生的结果相同:
|
所做的改动是捕获括号()改为非捕获捕获括号(?:)了.
还可以进一步完善为:
代码如下 | 复制代码 |
$string = "some text (a(b(c)d)e) more text"; if(preg_match("/((?>[^()]+|(?R))*)/",$string,$matches)) { echo " "; print_r($matches); echo ""; } ?> |
这里我们用到了所谓的一次性模式(rex注: 余晟先生译的《精通正则表达式v3.0》中, 谓之”固化分组”. 可参考该书.) PHP手册也推荐只要条件允许, 就尽可能使用这种模式, 以便提升正则表达式的速度.

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Dreamweaver Mac版
視覺化網頁開發工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3漢化版
中文版,非常好用

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中