>  기사  >  백엔드 개발  >  PHP 정규식

PHP 정규식

WBOY
WBOY원래의
2016-08-08 09:20:07858검색

정규식이란

정규식은 특정 문자를 결합하여 일반 문자열로 사용하여 문자열에 대해 작동하는 논리식입니다. , 이를 정규 매칭 패턴이라고 합니다.

$p = '/apple/'; $str = "apple banna"; if (preg_match($p, $str)) { echo 'matched'; }

'/apple/' 문자열은 사과 문자열이 소스 문자열에 존재하는지 여부를 일치시키는 데 사용되는 정규식입니다.

PHP에서는 정규 매칭을 위해 PCRE 라이브러리 함수를 사용합니다. 예를 들어, 위 예의 preg_match는 정규 매칭을 수행하는 데 사용되며, 이는 문자 유형을 결정하는 데 자주 사용됩니다. 패턴이 존재합니다.

정규식의 기본 구문

PCRE 라이브러리 함수에서 일반 일치 패턴은 구분 기호와 메타 문자를 사용합니다. 구분 기호는 숫자, 백슬래시 및 공백이 아닌 문자를 제외한 모든 문자일 수 있습니다. 일반적으로 사용되는 구분 기호는 슬래시(/), 해시 기호(#) 및 부정 기호(~)입니다. 예:

/foo bar/ #^[^0-9]$# ~php~

패턴에 구분 기호가 포함된 경우 구분 기호는 다음과 같아야 합니다. 백슬래시()를 사용하여 이스케이프 처리합니다.

/http:\/\//

패턴에 구분 문자가 많이 포함된 경우 다른 문자를 구분 기호로 사용하는 것이 좋습니다. 또는 preg_quote를 사용하여 이스케이프할 수 있습니다.

$p = 'http://'; $p = '/'.preg_quote($p, '/').'/'; echo $p;

패턴 수정자는 구분 기호 뒤에 사용할 수 있습니다. 패턴 수정자에는 i, m, s, x 등이 포함됩니다. 예를 들어 i 수정자를 사용하면 대소문자 일치를 무시할 수 있습니다.

$str = "Http://www.imooc.com/"; if (preg_match('/http/i', $str)) { echo '匹配成功'; }

메타 문자 및 이스케이프

는 정규 표현식에서 특별한 의미를 갖습니다. 일반적으로 사용되는 메타 문자는

입니다. 일반적으로 대상(또는 여러 줄 모드의 줄)의 시작 위치를 확인하기 위해
^ 문자를 이스케이프하는 데 사용됩니다. ).start)
$ 대상의 끝 위치(또는 여러 줄 모드의 경우 줄 끝)
를 확인합니다. 개행 문자를 제외한 모든 문자와 일치합니다(기본값)
[시작 문자 클래스 정의
] 문자 종료 클래스 정의
| 선택적 분기 시작
(하위 그룹
의 시작 태그) 하위 그룹
의 종료 태그 0 또는 1 일치를 나타냅니다. 수량자의 탐욕적 성격을 변경하기 위해 수량자 뒤에 배치됩니다. (수량자 조회)
* 수량자, 0개 이상의 일치
+ 수량자, 1개 이상의 일치
{사용자 정의 수량자 시작 태그
} 사용자 정의 수량자 종료 태그

//下面的\s匹配任意的空白符,包括空格,制表符,换行符。[^\s]代表非空白符。[^\s]+表示一次或多次匹配非空白符。 $p = '/^我[^\s]+(苹果|香蕉)$/'; $str = "我喜欢吃苹果"; if (preg_match($p, $str)) { echo '匹配成功'; }

메타문자에는 두 가지 사용 시나리오가 있습니다. 하나는 어디에서나 사용할 수 있다는 것이고, 다른 하나는 대괄호 안에만 사용할 수 있다는 것입니다.

이스케이프 문자
^은 첫 번째 문자(대괄호 안)로 사용되는 경우에만 문자 클래스의 부정을 나타냅니다.
- 문자 범위를 표시합니다

^가 뒷괄호 바깥쪽에 있으면 어설션 대상의 시작 위치를 나타내지만 대괄호 안에 있으면 문자 클래스의 부정을 나타냅니다. 대괄호 안의 빼기 기호는 0과 같은 문자 범위를 표시할 수 있습니다. -9. 0에서 9 사이의 모든 숫자.

//下面的\w匹配字母或数字或下划线。 $p = '/[\w\.\-]+@[a-z0-9\-]+\.(com|cn)/'; $str = "我的邮箱是Spark.eric@imooc.com"; preg_match($p, $str, $match); echo $match[0];

그리디 모드와 게으른 모드

각각의 정규식은 메타 문자는 문자와 일치합니다. +를 사용하면 탐욕스러워집니다. 가능한 한 많은 문자와 일치하지만 물음표 ? 문자를 사용하면 가능한 한 적은 문자와 일치하므로 게으른 모드입니다.

그리디 모드: 일치할 수 있거나 없을 때 매칭을 우선시합니다.

//下面的\d表示匹配数字 $p = '/\d+\-\d+/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:010-12345678

게으른 모드: 일치할 수 있거나 없을 때 일치하면 먼저 일치합니다.

$p = '/\d?\-\d?/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:0-1

일치하지 않는 경우 일치하는 문자의 길이를 정확히 알면 {}를 사용하여 일치하는 문자 수를 지정할 수 있습니다.

$p = '/\d{3}\-\d{8}/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:010-12345678

정규식을 사용하여 일치

정규식을 사용하는 목적 문자열 처리보다 더 나은 결과를 얻는 것입니다. 이 함수는 보다 유연한 처리 방법을 가지므로 문자열 처리 함수와 마찬가지로 부분 문자열이 있는지 확인하고 문자열을 교체하고 문자열을 분할하고 패턴 부분 문자열을 얻는 등의 작업에 주로 사용됩니다.

PHP는 PCRE 라이브러리 함수를 사용하여 패턴을 설정한 후 관련 처리 함수를 호출하여 일치하는 결과를 얻는 방식으로 일반적인 처리를 수행합니다.

preg_match는 일치를 수행하는 데 사용되며, 패턴이 성공적으로 일치하는지 확인하거나 일치하는 결과를 얻는 데 사용할 수 있습니다. 0 또는 1. 1회 일치 후 검색이 중지됩니다.

$subject = "abcdef"; $pattern = '/def/'; preg_match($pattern, $subject, $matches); print_r($matches); //结果为:Array ( [0] => def )

위 코드는 단순히 일치를 수행하고 단순히 def가 일치할 수 있는지 여부를 결정하지만 정규식의 힘은 패턴 일치이므로 더 많은 경우 패턴이 일치하게 됩니다. 사용됨:

$subject = "abcdef"; $pattern = '/a(.*?)d/'; preg_match($pattern, $subject, $matches); print_r($matches); //结果为:Array ( [0] => abcd [1] => bc )

정규식을 사용하여 패턴을 일치시키고 더 유용한 데이터를 얻을 수 있습니다.

查找所有匹配结果

preg_match只能匹配一次结果,但很多时候我们需要匹配所有的结果,preg_match_all可以循环获取一个列表的匹配结果数组。

$p = "|<[^>]+>(.*?)]+>|i"; $str = "example:
this is a test
"; preg_match_all($p, $str, $matches); print_r($matches);

可以使用preg_match_all匹配一个表格中的数据:

$p = "/(.*?)<\/td>\s*(.*?)<\/td>\s*<\/tr>/i"; $str = "
Eric25
John26
"; preg_match_all($p, $str, $matches); print_r($matches);

$matches结果排序为$matches[0]保存完整模式的所有匹配, $matches[1] 保存第一个子组的所有匹配,以此类推。

正则表达式的搜索和替换

正则表达式的搜索与替换在某些方面具有重要用途,比如调整目标字符串的格式,改变目标字符串中匹配字符串的顺序等。

例如我们可以简单的调整字符串的日期格式:

$string = 'April 15, 2014'; $pattern = '/(\w+) (\d+), (\d+)/i'; $replacement = '$3, ${1} $2'; echo preg_replace($pattern, $replacement, $string); //结果为:2014, April 15

其中${1}与$1的写法是等效的,表示第一个匹配的字串,$2代表第二个匹配的。

通过复杂的模式,我们可以更加精确的替换目标字符串的内容。

$patterns = array ('/(19|20)(\d{2})-(\d{1,2})-(\d{1,2})/', '/^\s*{(\w+)}\s*=/'); $replace = array ('\3/\4/\1\2', '$\1 =');//\3等效于$3,\4等效于$4,依次类推 echo preg_replace($patterns, $replace, '{startDate} = 1999-5-27'); //结果为:$startDate = 5/27/1999 //详细解释下结果:(19|20)表示取19或者20中任意一个数字,(\d{2})表示两个数字,(\d{1,2})表示1个或2个数字,(\d{1,2})表示1个或2个数字。^\s*{(\w+)\s*=}表示以任意空格开头的,并且包含在{}中的字符,并且以任意空格结尾的,最后有个=号的。

用正则替换来去掉多余的空格与字符:

$str = 'one two'; $str = preg_replace('/\s+/', ' ', $str); echo $str; // 结果改变为'one two'

正则匹配常用案例

正则匹配常用在表单验证上,一些字段会有一定的格式要求,比如用户名一般都要求必须是字母、数字或下划线组成,邮箱、电话等也都有自己的规则,因此使用正则表达式可以很好的对这些字段进行验证。

版权声明:本文为博主原创文章,未经博主允许不得转载。

以上就介绍了php正则表达式,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.