首頁  >  文章  >  web前端  >  正規的模式修飾符使用詳解

正規的模式修飾符使用詳解

php中世界最好的语言
php中世界最好的语言原創
2018-03-30 13:35:381790瀏覽

这次给大家带来正则的模式修饰符使用详解,使用正则模式修饰符的注意事项有哪些,下面就是实战案例,一起来看一下。

i (PCRE_CASELESS)

如果设置了这个修饰符,模式中的字母会进行大小写不敏感匹配。

m (PCRE_MULTILINE)

默认情况下,PCRE 认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), “行首”元字符 (^) 仅匹配字符串的开始位置, 而”行末”元字符 ($) 仅匹配字符串末尾, 或者最后的换行符(除非设置了 D 修饰符)。这个行为和 perl 相同。 当这个修饰符设置之后,“行首”和“行末”就会匹配目标字符串中任意换行符之前或之后,另外, 还分别匹配目标字符串的最开始和最末尾位置。这等同于 perl 的 /m 修饰符。如果目标字符串 中没有 “\n” 字符,或者模式中没有出现 ^ 或 $,设置这个修饰符不产生任何影响。

s (PCRE_DOTALL)

如果设置了这个修饰符,模式中的点号元字符匹配所有字符,包含换行符。如果没有这个 修饰符,点号不匹配换行符。这个修饰符等同于 perl 中的/s修饰符。 一个取反字符类比如 [^a] 总是匹配换行符,而不依赖于这个修饰符的设置。

x (PCRE_EXTENDED)

如果设置了这个修饰符,模式中的没有经过转义的或不在字符类中的空白数据字符总会被忽略, 并且位于一个未转义的字符类外部的#字符和下一个换行符之间的字符也被忽略。 这个修饰符 等同于 perl 中的 /x 修饰符,使被编译模式中可以包含注释。 注意:这仅用于数据字符。 空白字符 还是不能在模式的特殊字符序列中出现,比如序列 (?( 引入了一个条件子组(译注: 这种语法定义的 特殊字符序列中如果出现空白字符会导致编译错误。 比如(?(就会导致错误)。

e (PREG_REPLACE_EVAL)

Warning

本特性已自 PHP 5.5.0 起废弃。强烈建议不要使用本特性。

如果设置了这个被弃用的修饰符, preg_replace() 在进行了对替换字符串的 后向引用替换之后, 将替换后的字符串作为php 代码评估执行(eval 函数方式),并使用执行结果 作为实际参与替换的字符串。单引号、双引号、反斜线(\)和 NULL 字符在 后向引用替换时会被用反斜线转义.

Caution

The addslashes() function is run on each matched backreference before the substitution takes place. As such, when the backreference is used as a quoted string, escaped characters will be converted to literals. However, characters which are escaped, which would normally not be converted, will retain their slashes. This makes use of this modifier very complicated.

Caution

请确保 replacement 参数由合法 php 代码字符串组成,否则 php 将会 在preg_replace() 调用的行上产生一个解释错误。

Caution

Use of this modifier is discouraged, as it can easily introduce security vulnerabilites:

<?php
$html = $_POST[&#39;html&#39;];// uppercase headings
$html = preg_replace(
&#39;(<h([1-6])>(.*?)</h\1>)e',
'"<h$1>" . strtoupper("$2") . "</h$1>"',
$html
);

The above example code can be easily exploited by passing in a string such as

{${eval($_GET[php_code])}}

. This gives the attacker the ability to execute arbitrary PHP code and as such gives him nearly complete access to your server.

To prevent this kind of remote code execution vulnerability the preg_replace_callback() function should be used instead:

<?php
$html = $_POST[&#39;html&#39;];// uppercase headings
$html = preg_replace_callback(
&#39;(<h([1-6])>(.*?)</h\1>)',
function ($m) {
return "<h$m[1]>" . strtoupper($m[2]) . "</h$m[1]>"
},
$html
);

Note:

仅 preg_replace() 使用此修饰符,其他 PCRE 函数忽略此修饰符。

A (PCRE_ANCHORED)
如果設定了這個修飾符,模式被強制為」錨定」模式,也就是說約束匹配使其僅從 目標字串的開始位置搜尋。這個效果同樣可以使用適當的模式來建構出來,而且 這也是 perl 種實現這種模式的唯一途徑。
D (PCRE_DOLLAR_ENDONLY)
如果這個修飾符被設置,模式中的元字元美元符號只是匹配目標字串的結尾。如果這個修飾符 沒有設置,當字串以一個換行符號結尾時, 美元符號還會匹配該換行符號(但不會匹配之前的任何換行符)。 如果設定了修飾符m,這個修飾符被忽略. 在 perl 中沒有與此修飾符等同的修飾符。
S
當一個模式需要多次使用的時候,為了得到匹配速度的提升,值得花費一些時間 對其進行一些額外的分析。如果設定了這個修飾符,這個額外的分析就會執行。目前, 這種對一個模式的分析僅僅適用於非錨定模式的匹配(即沒有單獨的固定開始字元)。
U (PCRE_UNGREEDY)
這個修飾符逆轉了量詞的」貪婪」模式。 使量詞預設為非貪婪的,透過量詞後緊接? 的方式可以使其成為貪婪的。這和 perl 是不相容的。 它同樣可以使用 模式內修飾符設定 (?U)進行設置, 或在量詞後面以問號標記其非貪婪(例如.*?)。
Note:

在非貪婪模式,通常無法匹配超過 pcre.backtrack_limit 的字元。

X (PCRE_EXTRA)
這個修飾符開啟了 PCRE 與 perl 不相容的附件功能。模式中的任意反斜線後就 ingen 一個 沒有特殊意義的字元都會導致一個錯誤,以此保留這些字元以保證向後相容性。 預設情況下,在 perl 中,反斜線緊跟著一個沒有特殊意義的字元被認為是該字元的原文。 目前沒有其他特性由這個修飾符控制。
J (PCRE_INFO_JCHANGED)
內部選項設定(?J)修改本地的PCRE_DUPNAMES選項。允許子組重名,(譯註:只能透過內部選項設置,外部的/J 設定會產生錯誤。)
u (PCRE_UTF8)
此修正符號開啟一個與perl 不相容的附加功能。 模式字串被認為是utf-8的. 這個修飾符 從 unix 版php 4.1.0 或更高,win32版 php 4.2.3 開始可用。 php 4.3.5 開始檢查模式的 utf-8 合法性。

相信看了本文案例你已經掌握了方法,更多精彩請關注php中文網其它相關文章!

推薦閱讀:

正規表示式的\d元字元使用詳解(附程式碼)

Linux中使用正規表示式的詳細介紹

以上是正規的模式修飾符使用詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn