这次给大家带来正则的模式修饰符使用详解,使用正则模式修饰符的注意事项有哪些,下面就是实战案例,一起来看一下。
i (PCRE_CASELESS)
如果设置了这个修饰符,模式中的字母会进行大小写不敏感匹配。
m (PCRE_MULTILINE)
默认情况下,PCRE 认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), “行首”元字符 (^) 仅匹配字符串的开始位置, 而”行末”元字符 ($) 仅匹配字符串末尾, 或者最后的换行符(除非设置了 D 修饰符)。这个行为和 perl 相同。 当这个修饰符设置之后,“行首”和“行末”就会匹配目标字符串中任意换行符之前或之后,另外, 还分别匹配目标字符串的最开始和最末尾位置。这等同于 perl 的 /m 修饰符。如果目标字符串 中没有 “\n” 字符,或者模式中没有出现 ^ 或 $,设置这个修饰符不产生任何影响。
s (PCRE_DOTALL)
如果设置了这个修饰符,模式中的点号元字符匹配所有字符,包含换行符。如果没有这个 修饰符,点号不匹配换行符。这个修饰符等同于 perl 中的/s修饰符。 一个取反字符类比如 [^a] 总是匹配换行符,而不依赖于这个修饰符的设置。
x (PCRE_EXTENDED)
如果设置了这个修饰符,模式中的没有经过转义的或不在字符类中的空白数据字符总会被忽略, 并且位于一个未转义的字符类外部的#字符和下一个换行符之间的字符也被忽略。 这个修饰符 等同于 perl 中的 /x 修饰符,使被编译模式中可以包含注释。 注意:这仅用于数据字符。 空白字符 还是不能在模式的特殊字符序列中出现,比如序列 (?( 引入了一个条件子组(译注: 这种语法定义的 特殊字符序列中如果出现空白字符会导致编译错误。 比如(?(就会导致错误)。
e (PREG_REPLACE_EVAL)
Warning
本特性已自 PHP 5.5.0 起废弃。强烈建议不要使用本特性。
如果设置了这个被弃用的修饰符, preg_replace() 在进行了对替换字符串的 后向引用替换之后, 将替换后的字符串作为php 代码评估执行(eval 函数方式),并使用执行结果 作为实际参与替换的字符串。单引号、双引号、反斜线(\)和 NULL 字符在 后向引用替换时会被用反斜线转义.
Caution
The addslashes() function is run on each matched backreference before the substitution takes place. As such, when the backreference is used as a quoted string, escaped characters will be converted to literals. However, characters which are escaped, which would normally not be converted, will retain their slashes. This makes use of this modifier very complicated.
Caution
请确保 replacement 参数由合法 php 代码字符串组成,否则 php 将会 在preg_replace() 调用的行上产生一个解释错误。
Caution
Use of this modifier is discouraged, as it can easily introduce security vulnerabilites:
<?php $html = $_POST['html'];// uppercase headings $html = preg_replace( '(<h([1-6])>(.*?)</h\1>)e', '"<h$1>" . strtoupper("$2") . "</h$1>"', $html );
The above example code can be easily exploited by passing in a string such as
To prevent this kind of remote code execution vulnerability the preg_replace_callback() function should be used instead:
<?php $html = $_POST['html'];// uppercase headings $html = preg_replace_callback( '(<h([1-6])>(.*?)</h\1>)', function ($m) { return "<h$m[1]>" . strtoupper($m[2]) . "</h$m[1]>" }, $html );
Note:
仅 preg_replace() 使用此修饰符,其他 PCRE 函数忽略此修饰符。
A (PCRE_ANCHORED)
이 수정자를 설정하면 패턴이 강제로 "앵커된" 패턴이 됩니다. 즉, 일치 항목이 대상 문자열의 시작 부분에서만 검색되도록 제한됩니다. 이 효과는 적절한 패턴을 사용하여 구성할 수도 있으며 Perl에서 이 패턴을 구현하는 유일한 방법입니다.
D (PCRE_DOLLAR_ENDONLY)
이 수정자를 설정하면 패턴의 메타 문자 달러 기호는 대상 문자열의 끝과만 일치합니다. 이 수정자가 설정되지 않은 경우 문자열이 개행 문자로 끝날 때 달러 기호도 해당 개행 문자와 일치합니다(단, 이전 개행 문자는 제외). 수정자 m이 설정되면 이 수정자는 Perl에 이 수정자와 동일하지 않습니다.
S
패턴을 여러 번 사용해야 하는 경우 일치 속도를 향상하려면 시간을 들여 추가 분석을 수행하는 것이 좋습니다. 이 수정자가 설정되면 이 추가 분석이 수행됩니다. 현재 이 패턴 분석은 고정되지 않은 패턴 일치(즉, 단일 고정 시작 문자 없음)에만 적용됩니다.
U (PCRE_UNGREEDY)
이 수정자는 수량어의 "탐욕" 모드를 반전시킵니다. 기본적으로 수량자를 non-greedy로 만듭니다. 수량자 뒤에 ?를 추가하면 욕심이 없게 만들 수 있습니다. 이는 Perl과 호환되지 않습니다. 또한 인트라 모드 수정자 설정(?U)을 사용하거나 수량자 뒤에 물음표를 사용하여 non-greedy로 표시하여 설정할 수도 있습니다(예: .*?).
참고:
non-greedy 모드에서는 pcre.backtrack_limit를 초과하는 문자는 일반적으로 일치하지 않습니다.
X (PCRE_EXTRA)
이 수정자는 PCRE와 Perl 간에 호환되지 않는 첨부 기능을 활성화합니다. 패턴의 백슬래시 뒤에 특별한 의미가 없는 문자가 오면 오류가 발생하며 이러한 문자는 이전 버전과의 호환성을 위해 보존됩니다. 기본적으로 Perl에서는 백슬래시 뒤에 특별한 의미가 없는 문자가 오는 것이 해당 문자의 원본 텍스트로 간주됩니다. 현재 이 수정자로 제어되는 다른 기능은 없습니다.
J (PCRE_INFO_JCHANGED)
내부 옵션 설정(?J) 로컬 PCRE_DUPNAMES 옵션을 수정합니다. 중복된 이름을 가진 하위 그룹을 허용합니다. (주석: 내부 옵션을 통해서만 설정할 수 있으며 외부 /J 설정은 오류를 생성합니다.)
u (PCRE_UTF8)
이 수정자는 Perl과 호환되지 않는 추가 기능을 활성화합니다. 패턴 문자열은 UTF-8로 간주됩니다. 이 수정자는 Unix의 경우 PHP 4.1.0 이상, Win32의 경우 PHP 4.2.3부터 사용할 수 있습니다. PHP 4.3.5는 패턴의 utf-8 유효성 검사를 시작합니다.
이 기사의 사례를 읽은 후 방법을 마스터했다고 생각합니다. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사를 주목하세요!
추천 도서:
정규식에서 d 메타 문자 사용에 대한 자세한 설명(코드 포함)
위 내용은 일반 패턴 수정자 사용에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!