>백엔드 개발 >PHP 튜토리얼 >PHP의 정규식 (1)

PHP의 정규식 (1)

PHPz
PHPz원래의
2016-07-29 08:34:451461검색

PHP는 *NIX의 일관된 전통을 계승하고 정규식 처리를 완벽하게 지원합니다. 정규식은 고급이지만 직관적이지 않은 문자열 일치 및 처리 방법을 제공합니다. PERL의 정규식을 사용해 본 친구들은 정규식이 매우 강력하다는 것을 알고 있지만 배우기가 쉽지 않습니다.

예:

^. \ $

이 효과는 있지만 이해하기 어려운 코드는 일부 프로그래머에게 두통을 주기에 충분합니다. 정규식을 사용해 보세요. 이 튜토리얼을 다 읽고 나면 이 코드의 의미를 이해하게 될 것이라고 믿습니다.

기본 패턴 매칭

모든 것은 기본부터 시작됩니다. 패턴은 정규식의 가장 기본적인 요소이며 문자열의 특성을 설명하는 문자 집합입니다. 패턴은 일반 문자열로 구성된 단순할 수도 있고, 특수 문자를 사용하여 다양한 문자, 반복 또는 컨텍스트를 나타내는 경우가 많은 매우 복잡한 것일 수도 있습니다. 예:

^once

이 패턴에는 특수 문자 ^가 포함되어 있습니다. 이는 패턴이 one으로 시작하는 문자열과만 일치한다는 의미입니다. 예를 들어, 이 패턴은 "once upon a time"이라는 문자열과 일치하지만 "There Once was a man from NewYork"와는 일치하지 않습니다. ^ 기호가 시작을 나타내는 것처럼 $ 기호는 주어진 패턴으로 끝나는 문자열과 일치합니다.

bucket$

이 패턴은 "누가 이 현금을 모두 양동이에 보관했는지"와 일치하지만 "buckets"와는 일치하지 않습니다. ^ 및 $ 문자를 함께 사용하면 정확한 일치를 나타냅니다(문자열은 패턴과 동일함). 예를 들어

^bucket$

은 "bucket" 문자열에만 일치합니다. 패턴에 ^ 및 $가 포함되어 있지 않으면 패턴이 포함된 모든 문자열과 일치합니다. 예: 패턴

한 번

및 문자열

한때 뉴욕에서 온 한 남자가

현금을 모두 양동이에 담아 두었습니다.

이(가) 일치합니다.

이 패턴의 문자(o-n-c-e)는 문자 그대로의 문자입니다. 즉, 숫자와 마찬가지로 문자 자체를 나타냅니다. 문장 부호 및 흰색 문자(공백, 탭 등)와 같은 약간 더 복잡한 문자에는 이스케이프 시퀀스가 ​​필요합니다. 모든 이스케이프 시퀀스는 백슬래시()로 시작됩니다. 탭 문자의 이스케이프 시퀀스는 t입니다. 따라서 문자열이 탭 문자로 시작하는지 감지하려면 다음 패턴을 사용할 수 있습니다.

^t

마찬가지로 n을 사용하여 "새 줄"을 나타내고 r을 사용하여 캐리지를 나타냅니다. 반품. 백슬래시를 앞에 두고 다른 특수 기호를 사용할 수 있습니다. 예를 들어 백슬래시 자체는 \, 마침표로 표시됩니다. . 등으로 표시됩니다.

문자 클러스터

INTERNET 프로그램에서는 일반적으로 사용자 입력을 확인하기 위해 정규식을 사용합니다. 사용자가 FORM을 제출할 때 입력된 전화번호, 주소, 이메일 주소, 신용카드 번호 등이 유효한지 확인하기 위해 일반 리터럴 문자를 사용하는 것만으로는 충분하지 않습니다.

따라서 우리가 원하는 패턴을 설명하기 위해 좀 더 자유로운 방법, 즉 문자 클러스터를 사용해야 합니다. 모든 모음 문자를 나타내는 클러스터를 만들려면 모든 모음 문자를 대괄호로 묶습니다.

[AaEeIiOoUu]

이 패턴은 모든 모음 문자와 일치하지만 하나의 문자만 나타낼 수 있습니다. 하이픈을 사용하여 다음과 같이 문자 범위를 나타냅니다.

[a-z] // 모든 소문자 일치

[A-Z] // 모든 대문자 일치

[a -zA-Z] // 모든 문자 일치

[0-9] // 모든 숫자 일치

[0-9.-] // 모든 숫자, 마침표 및 빼기 기호 일치

[ frtn] // 모든 흰색 문자와 일치

다시 말하지만, 이는 매우 중요한 문자 하나만 나타냅니다. "z2", "t6" 또는 "g7"과 같이 소문자와 숫자로 구성된 문자열을 일치시키되 "ab2", "r2d3" 또는 "b52"는 일치시키지 않으려면 다음 패턴을 사용하십시오.

^[a-z][0-9]$

[a-z]는 26자의 범위를 나타내지만 여기서는 첫 번째 문자가 소문자인 문자열에만 일치할 수 있습니다.

앞서 ^가 문자열의 시작을 나타낸다고 언급했지만 또 다른 의미도 있습니다. ^가 대괄호 안에 사용되면 "아님" 또는 "제외"를 의미하며 특정 문자를 제거하는 데 자주 사용됩니다. 이전 예를 사용하면 첫 번째 문자는 숫자가 될 수 없습니다.

^[^0-9][0-9]$

이 패턴은 "&5"와 동일합니다. , "g7"과 "-2"는 일치하지만 "12"와 "66"은 일치하지 않습니다. 특정 문자를 제외하는 몇 가지 예는 다음과 같습니다.

[^a-z] //소문자를 제외한 모든 문자

[^\/^] //() 제외 (/) ( 모든 문자 제외 ^)

[^"'] //큰따옴표(")와 작은따옴표(')를 제외한 모든 문자

일반문자에서는 "."를 사용합니다. "새 줄"을 제외한 모든 문자를 나타내는 표현식입니다. 따라서 "^.5$" 패턴은 숫자 5로 끝나고 "줄바꿈"이 아닌 다른 문자로 시작하는 두 문자 문자열과 일치합니다. "." 패턴은 빈 문자열과 "새 줄"만 포함하는 문자열을 제외한 모든 문자열과 일치할 수 있습니다.

PHP의 정규식에는 일부 내장된 범용 문자 클러스터가 있으며 목록은 다음과 같습니다.

문자 클러스터 의미

[[:alpha:]] 모든 문자

[[:digit:]] 모든 숫자

[[:alnum:]] 모든 문자 및 숫자

[[:space:]] 모든 흰색 문자

[[:upper:]] 모든 대문자

[[:lower:]] 모든 소문자

[[:punct:]] 구두점

[[:xdigit:]] 임의의 16진수, [0-9a-fA-F]

에 해당
성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.