常用PHP正则表达式整理-PHP 튜토리얼-php.cn

집

백엔드 개발

PHP 튜토리얼

常用PHP正则表达式整理

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 20, 2016 pm 01:02 PM

PHP 정규 표현식

常用PHP正则表达式整理

1.普通字符

由所有那些未显式指定为元字符的打印和非打印字符组成。这包括所有的大写和小写字母字符(a-z)，所有数字(o-9)，所有标点符号以及一些符号。

2 非打印字符

字符含义

\cx匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 ‘c’ 字符。

\f匹配一个换页符。等价于 \x0c 和 \cL。

\n匹配一个换行符。等价于 \x0a 和 \cJ。

\r匹配一个回车符。等价于 \x0d 和 \cM。

\s匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

\S匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。

\t匹配一个制表符。等价于 \x09 和 \cI。

\v匹配一个垂直制表符。等价于 \x0b 和 \cK。

3.特殊字符(元字符)

所谓特殊字符，就是一些有特殊含义的字符，如上面说的”*.txt”中的*，简单的说就是表示任何字符串的意思。如果要查找文件名中有＊的文件，则需要对＊进行转义，即在其前加一个\。ls \*.txt。正则表达式有以下特殊字符。

特别字符说明

$匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身，请使用 \$。

( )标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 $ 和 $。

*匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 \*。

+匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 \+。

.匹配除换行符 \n之外的任何单字符。要匹配 .，请使用 \。

[标记一个中括号表达式的开始。要匹配 [，请使用 \[。

?匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 \?。

\将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， ‘n’ 匹配字符 ‘n’。’\n’ 匹配换行符。序列 ‘\\’ 匹配 “\”，而 ‘\(’ 则匹配 “(”。

^匹配输入字符串的开始位置，除非在方括号表达式中使用，此时它表示不接受该字符集合。要匹配 ^ 字符本身，请使用 \^。

{标记限定符表达式的开始。要匹配 {，请使用 \{。

|指明两项之间的一个选择。要匹配 |，请使用 \|。

4 限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有*或+或?或{n}或{n,}或{n,m}共6种。

*、+和?限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

正则表达式的限定符有：

字符描述

*匹配前面的子表达式零次或多次。例如，zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。

+匹配前面的子表达式一次或多次。例如，’zo+’ 能匹配 “zo” 以及 “zoo”，但不能匹配 “z”。+ 等价于 {1,}。

?匹配前面的子表达式零次或一次。例如，”do(es)?” 可以匹配 “do” 或 “does” 中的”do” 。? 等价于 {0,1}。

{n}n 是一个非负整数。匹配确定的 n 次。例如，’o{2}’ 不能匹配 “Bob” 中的 ‘o’，但是能匹配 “food” 中的两个 o。

{n,}n 是一个非负整数。至少匹配n 次。例如，’o{2,}’ 不能匹配 “Bob” 中的 ‘o’，但能匹配 “foooood” 中的所有 o。’o{1,}’ 等价于 ‘o+’。’o{0,}’ 则等价于 ‘o*’。

{n,m}m 和 n 均为非负整数，其中n

5 定位符

用来描述字符串或单词的边界，^和$分别指字符串的开始与结束，\b描述单词的前或后边界，\B表示非单词边界。不能对定位符使用限定符。

6.定界符

除了字母、数字和反斜线\以外的任何字符都可以为定界符号，比如 | |、//、{}、!!等等，但是需要注意，如果没有特殊需要，我们都使用正斜线//作为正则表达式的定界符号。

7. 选择

用圆括号将所有选择项括起来，相邻的选择项之间用|分隔。但用圆括号会有一个副作用，是相关的匹配会被缓存，此时可用?:放在第一个选项前来消除这种副作用。

其中?:是非捕获元之一，还有两个非捕获元是?=和?!，这两个还有更多的含义，前者为正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串，后者为负向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

8.后向引用

对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中，所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。存储子匹配的缓冲区编号从 1 开始，连续编号直至最大 99 个子表达式。每个缓冲区都可以使用 ‘\n’ 访问，其中 n 为一个标识特定缓冲区的一位或两位十进制数。

可以使用非捕获元字符 ‘?:’, ‘?=’, or ‘?!’ 来忽略对相关匹配的保存。

9.全部符号解释

字符描述

\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，’n’ 匹配字符 “n”。’\n’ 匹配一个换行符。序列 ‘\\’ 匹配 “\” 而 “\(” 则匹配 “(”。

^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置。

$匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性，$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置。

*匹配前面的子表达式零次或多次。例如，zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。

+匹配前面的子表达式一次或多次。例如，’zo+’ 能匹配 “zo” 以及 “zoo”，但不能匹配 “z”。+ 等价于 {1,}。

?匹配前面的子表达式零次或一次。例如，”do(es)?” 可以匹配 “do” 或 “does” 中的”do” 。? 等价于 {0,1}。

{n}n 是一个非负整数。匹配确定的 n 次。例如，’o{2}’ 不能匹配 “Bob” 中的 ‘o’，但是能匹配 “food” 中的两个 o。

{n,m}m 和 n 均为非负整数，其中n

?当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串 “oooo”，’o+?’ 将匹配单个 “o”，而 ‘o+’ 将匹配所有 ‘o’。

.匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符，请使用象 ‘[.\n]’ 的模式。

(pattern)匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到，在VBScript 中使用 SubMatches 集合，在JScript 中则使用 $0…$9 属性。要匹配圆括号字符，请使用 ‘$’ 或 ‘$’。

(?:pattern)匹配 pattern 但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用 “或” 字符 (|) 来组合一个模式的各个部分是很有用。例如， ‘industr(?:y|ies) 就是一个比 ‘industry|industries’ 更简略的表达式。

(?=pattern)正向预查，在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，’Windows (?=95|98|NT|2000)’ 能匹配 “Windows 2000″ 中的 “Windows” ，但不能匹配 “Windows 3.1″ 中的 “Windows”。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。

(?!pattern)负向预查，在任何不匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如’Windows (?!95|98|NT|2000)’ 能匹配 “Windows 3.1″ 中的 “Windows”，但不能匹配 “Windows 2000″ 中的 “Windows”。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始

x|y匹配 x 或 y。例如，’z|food’ 能匹配 “z” 或 “food”。’(z|f)ood’ 则匹配 “zood” 或 “food”。

[xyz]字符集合。匹配所包含的任意一个字符。例如， ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。

[^xyz]负值字符集合。匹配未包含的任意字符。例如， ‘[^abc]’ 可以匹配 “plain” 中的’p'。

[a-z]字符范围。匹配指定范围内的任意字符。例如，’[a-z]’ 可以匹配 ‘a’ 到 ‘z’ 范围内的任意小写字母字符。

[^a-z]负值字符范围。匹配任何不在指定范围内的任意字符。例如，’[^a-z]’ 可以匹配任何不在 ‘a’ 到 ‘z’ 范围内的任意字符。

\b匹配一个单词边界，也就是指单词和空格间的位置。例如， ‘er\b’ 可以匹配”never” 中的 ‘er’，但不能匹配 “verb” 中的 ‘er’。

\B匹配非单词边界。’er\B’ 能匹配 “verb” 中的 ‘er’，但不能匹配 “never” 中的 ‘er’。

\cx匹配由 x 指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 ‘c’ 字符。

\d匹配一个数字字符。等价于 [0-9]。

\D匹配一个非数字字符。等价于 [^0-9]。

\f匹配一个换页符。等价于 \x0c 和 \cL。

\n匹配一个换行符。等价于 \x0a 和 \cJ。

\r匹配一个回车符。等价于 \x0d 和 \cM。

\s匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

\S匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。

\t匹配一个制表符。等价于 \x09 和 \cI。

\v匹配一个垂直制表符。等价于 \x0b 和 \cK。

\w匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。

\W匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]’。

\xn匹配 n，其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，’\x41′ 匹配 “A”。’\x041′ 则等价于 ‘\x04′ & “1″。正则表达式中可以使用 ASCII 编码。.

\num匹配 num，其中 num 是一个正整数。对所获取的匹配的引用。例如，’(.)\1′ 匹配两个连续的相同字符。

\n标识一个八进制转义值或一个向后引用。如果 \n 之前至少 n 个获取的子表达式，则 n 为向后引用。否则，如果 n 为八进制数字 (0-7)，则 n 为一个八进制转义值。

\nm标识一个八进制转义值或一个向后引用。如果 \nm 之前至少有 nm 个获得子表达式，则 nm 为向后引用。如果 \nm 之前至少有 n 个获取，则 n 为一个后跟文字 m 的向后引用。如果前面的条件都不满足，若 n 和 m 均为八进制数字 (0-7)，则 \nm 将匹配八进制转义值 nm。

\nml如果 n 为八进制数字 (0-3)，且 m 和 l 均为八进制数字 (0-7)，则匹配八进制转义值 nml。

\un匹配 n，其中 n 是一个用四个十六进制数字表示的 Unicode 字符。例如， \u00A9 匹配版权符号 (?)。

10.模式修正符的构成

模式修正符就是字母，只不过这些在模式修正符的应用之中有特殊的含义。下面我来看看都有哪些模式修正符，请看下表：

模式修正符说明

i表示在和模式进行匹配进不区分大小写

m将模式视为多行，使用^和$表示任何一行都可以以正则表达式开始或结束

s如果没有使用这个模式修正符号，元字符中的"."默认不能表示换行符号,将字符串视为单行

x表示模式中的空白忽略不计

e正则表达式必须使用在preg_replace替换字符串的函数中时才可以使用(讲这个函数时再说)

A以模式字符串开头，相当于元字符^

Z以模式字符串结尾，相当于元字符$

U正则表达式的特点：就是比较“贪婪”，使用该模式修正符可以取消贪婪模式

最后注意：在PHP正则表达式中需要转义的字符如下：

$^*()+={}[]|/:<>.?&#39;"

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

如何使用PHP正则表达式验证输入是否是IPv6地址Jun 25, 2023 am 09:37 AM

IPv6是指InternetProtocolVersion6，是用于互联网通信的一种IP地址协议。IPv6地址是由128个比特位组成的数字，通常用8个16进制数分组表示。在PHP中，可以使用正则表达式来验证输入是否是IPv6地址，下面就介绍一下如何使用PHP正则表达式验证IPv6地址。第一步：了解IPv6地址的格式IPv6地址由8个16进制块组成，每个

如何用PHP正则表达式验证字符串是否为空Jun 24, 2023 am 08:46 AM

在PHP中，我们可以使用正则表达式来验证字符串是否为空。字符串为空的情况包括以下情况：字符串只包含空格。字符串长度为0。字符串为null或者未定义。接下来，我们将介绍如何使用PHP中的正则表达式来验证这些情况。正则表达式：s+这个正则表达式可以用来匹配只包含空格的字符串。其中s表示匹配空格，+表示匹配一个或多个。代码示例：functionisEmptySt

如何用PHP正则表达式验证电话号码格式Jun 24, 2023 am 08:44 AM

在编写Web应用程序时，经常需要进行电话号码的验证。PHP中常用的方法是使用正则表达式来判断电话号码的格式是否正确。正则表达式是一个强大的工具，它可以帮助您在简洁的语句中确定某些模式。下面是在PHP中使用正则表达式来验证电话号码格式的示例。首先，让我们定义电话号码的通用格式。电话号码可以包含数字、括号、连字符和空格。一个标准的电话号码应该包含10个数字，前

PHP正则表达式验证输入字符串是否为身份证号码或护照号码格式Jun 24, 2023 pm 12:11 PM

身份证号码和护照号码是人们生活中常见的证件号码。在实现涉及到这些证件号码的功能时，经常需要对输入的号码进行格式验证，以确保其正确性。而在PHP中，使用正则表达式可以很好地实现这一功能，本文就介绍如何使用PHP正则表达式验证输入字符串是否为身份证号码或护照号码格式。一、身份证号码验证身份证号码是由18位数字和最后一位可能是字母（校验码）组成的，其格式如下：前6

如何用PHP正则表达式验证URL地址格式Jun 24, 2023 am 09:51 AM

随着互联网的快速发展，URL地址已经成为了人们日常生活中不可或缺的一部分。在web开发中，为了保证用户输入的URL地址可以正确地被系统识别和使用，我们需要对其进行格式验证。本文将介绍如何使用PHP正则表达式来验证URL地址格式。一、URL地址的基本组成部分在了解如何验证URL地址格式之前，我们首先需要了解URL地址的基本组成部分。通常，一个标准的URL地址由

如何在PHP中使用正则表达式验证是否是文件路径Jun 24, 2023 am 10:18 AM

在PHP中，正则表达式是一种常用的字符串匹配和验证工具。在开发过程中，需要经常对输入的文件路径进行验证，确保其格式正确。本文将介绍如何使用正则表达式验证一个字符串是否是文件路径。首先，我们需要确定一个文件路径的基本格式。在Windows系统中，一个典型的文件路径是类似于“C:ProgramFilesPHPphp.exe”这样的格式。该路径分为以下几个部分：

如何用PHP正则表达式验证输入字符串是否为正确的身份证号码、护照号码或港澳通行证格式Jun 24, 2023 am 10:36 AM

身份证、护照和港澳通行证号码都是重要的个人身份证明，为了保障个人信息安全，我们需要在系统中验证用户输入的证件号码是否符合规范格式。而PHP正则表达式是一个非常强大的工具，可以方便地实现这个目的。本文将介绍如何使用PHP正则表达式验证用户输入的身份证号码、护照号码和港澳通行证号码。一、身份证号码格式验证身份证号码是18位数字，在最后一位可能是数字或字母X。身份

如何使用PHP正则表达式验证特定长度的输入Jun 24, 2023 am 10:17 AM

在开发Web应用程序时，经常需要验证用户输入是否符合特定的格式和长度要求。PHP正则表达式提供了一种强大的方法进行验证。本文将介绍如何使用PHP正则表达式验证特定长度的输入。确定输入的长度要求在开始编写正则表达式之前，需要确定输入的长度要求。例如，如果要求用户输入一个长度为8的密码，那么正则表达式应该匹配8个字符，而不是匹配大于等于8个字符的字符串。编写正则

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.