搜尋
首頁後端開發php教程PHP中的正規表達式
PHP中的正規表達式Nov 30, 2016 am 11:13 AM
Applephp

PHP繼承*NIX的一貫傳統,完全支援正規表達式的處理。正規表達式提供了一種高級的,但不直觀的字串匹配和處理的方法。用過PERL的正規表達式的朋友都知道,正規表達式的功能非常強大,但學起來不是那麼容易。 
例如:

^.+@.+..+$    

這段有效卻難以理解的程式碼足以讓一些程式設計師頭痛(我就是)或讓他們放棄使用正規表達式。相信當你讀完這個教學後,就可以理解這段程式碼的意思了。

基本模式匹配

一切從最基本的開始。模式,是正規表達式最基本的元素,它們是一組描述字串特徵的字元。模式可以很簡單,由普通的字串組成,也可以非常複雜,往往用特殊的字元表示一個範圍內的字元、重複出現,或表示上下文。例如:

^once    

這個模式包含一個特殊的字元^,表示模式只符合那些以once開頭的字串。例如該模式與字串"once upon a time"匹配,與"There once was a man from NewYork"不匹配。正如如^符號表示開頭一樣,$符號用來匹配那些以給定模式結尾的字串。

bucket$    

這個模式與"Who kept all of this cash in a bucket"匹配,與"buckets"不匹配。字元^和$同時使用時,表示精確匹配(字串與模式一樣)。例如:

^bucket$    

只符合字串"bucket"。如果一個模式不包括^和$,那麼它與任何包含該模式的字串相符。例如:模式

once    

與字串

There once was a man from NewYork
Who kept all of his cash in a bucket.

是相符的。

在該模式中的字母(o-n-c-e)是字面的字符,也就是說,他們表示該字母本身,數字也是一樣的。其他一些稍微複雜的字符,如標點符號和白字符(空格、製表符等),要用到轉義序列。所有的轉義序列都用反斜線()打頭。製表符的轉義序列是:t。所以如果我們要偵測一個字串是否以製表符開頭,可以用這個模式:

^t    

類似的,用n表示“新行”,r表示回車。其他的特殊符號,可以用在前面加上反斜杠,如反斜杠本身用表示,句號.用.表示,以此類推。

字符簇

在INTERNET的程式中,正規表達式通常用來驗證使用者的輸入。當使用者提交一個FORM以後,要判斷輸入的電話號碼、地址、EMAIL地址、信用卡號碼等是否有效,用普通的基於字面的字元是不夠的。

所以要用一種更自由的描述我們要的模式的辦法,它就是字符簇。要建立一個表示所有元音字符的字符簇,就把所有的元音字符放在一個方括號裡:

[AaEeIiOoUu]    

這個模式與任何元音字符匹配,但只能表示一個字符。用連字號可以表示一個字的範圍,如:

[a-z]    //配對所有的小寫字母   

[A-Z]    //符合所有的大寫字母   

[A-Z]    //符合所有的大寫字母字母   

[0-9]    //配對所有的數字   

[0-9.-]    //配對所有的數字,句號與減號,這些也只表示一個字符,這是一個非常重要的。如果要符合一個由一個小寫字母和一位數字組成的字串,例如"z2"、"t6"或"g7",但不是"ab2"、"r2d3" 或"b52"的話,用這個模式:

^[a-z][0-9]$    

儘管[a-z]代表26個字母的範圍,但在這裡它只能與第一個字符是小寫字母的字符串匹配。

前面曾經提到^表示字串的開頭,但它還有另外一個意義。當在一組方括號裡使用^是,它表示「非」或「排除」的意思,常常用來剔除某個字元。還用前面的例子,我們要求第一個字元不能是數字:

^[^0-9][0-9]$    

這個模式與"&5"、"g7"及"-2"是匹配的,但與"12"、"66"是不匹配的。以下是幾個排除特定字元的例子:

[^a-z]    //除了小寫字母以外的所有字元   

[^/^]    //除了"/"和"^" [^"']    //除了雙引號(")和單引號(')之外的所有字元   


特殊字元"." (點,句號)在正規表達式中用來表示除了「新行」之外的所有字元。所以模式"^.5$"與任何兩個字元的、以數字5結尾和以其他非「新行」字元開頭的字串相符。模式"."可以符合任何字串,除了空字串和只包括一個「新行」的字串。

PHP的正規表示式有一些內建的通用字元簇,清單如下:

字元簇   意義   

[[:alpha:]]    任何字母alnum:]]    任何字母與數字   

[[:space:]]    任何白字   

[[:upper:]]]    unct :]]    任何標點符號   

[[:xdigit:]]    任何16進位的數字,相當於[0-9a-fA-F]    

確定重複出現

到現在如何匹配一個字母或數字,但更多的情況下,可能要匹配一個單字或一組數字。一個單字有一個字母組成,一組數字有一個單數組成。跟在字元或字元簇後面的花括號({})用來確定前面的內容的重複出現的次數。

字符簇   含義   

^[a-zA-Z_]$    所有的字母和底線   

^[[:alpha 

^a{4}$    aaaa    

^a{2,4}$    aa,aaa或aaaa    

^a{1,3}$兩個a的字串   

^a{2,}    如:aardvark和aaab,但apple不行   

a{2,}    如:baad和aaa 

a{2,}    如:baad和aaa 

.{2}    所有的兩個字元   

這些例子描述了花括號的三種不同的用法。一個數字,{x}的意思是「前面的字元或字元簇只出現x次」;一個數字加逗號,{x,}的意思是「前面的內容出現x或更多的次數」;兩個用逗號分隔的數字,{x,y}表示「前面的內容至少出現x次,但不超過y次」。我們可以將模式擴展到更多的單字或數字:

^[a-zA-Z0-9_]{1,}$    //所有包含一個以上的字母、數字或底線的字串   

^[0 -9]{1,}$    //所有的正數   

^-{0,1}[0-9]{1,}$    //所有的整數   

^-{0,1}[0- 9]{0,}.{0,1}[0-9]{0,}$    //所有的小數   

最後一個例子不太好理解,是嗎?這麼看吧:與所有以一個可選的負號(-{0,1})開頭(^)、跟著0個或更多的數字([0-9]{0,})、和一個可選的小數點(.{0,1})再跟上0個或多個數字([0-9]{0,}),並且沒有其他任何東西($)。下面你將知道能夠使用的更簡單的方法。

特殊字元"?"與{0,1}是相等的,它們都代表著:「0個或1個前面的內容」或「前面的內容是可選的」。所以剛才的例子可以簡化為:

^-?[0-9]{0,}.?[0-9]{0,}$    

特殊字元"*"與{0,}是相等的,它們都代表著「0個或多個前面的內容」。最後,字元"+"與{1,}是相等的,表示“1個或多個前面的內容”,所以上面的4個例子可以寫成:

^[a-zA-Z0-9_]+$ //所有包含一個以上的字母、數字或底線的字串   

^[0-9]+$    //所有的正數   

^-?[0-9]+$   //所有的整數

^-?[0-9]+$   //所有的整數 ^-?[0-9]*.?[0-9]*$    //所有的小數   

當然這並不能從技術上降低正規表達式的複雜性,但可以使它們更容易閱讀。

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
php怎么把负数转为正整数php怎么把负数转为正整数Apr 19, 2022 pm 08:59 PM

php把负数转为正整数的方法:1、使用abs()函数将负数转为正数,使用intval()函数对正数取整,转为正整数,语法“intval(abs($number))”;2、利用“~”位运算符将负数取反加一,语法“~$number + 1”。

php怎么实现几秒后执行一个函数php怎么实现几秒后执行一个函数Apr 24, 2022 pm 01:12 PM

实现方法:1、使用“sleep(延迟秒数)”语句,可延迟执行函数若干秒;2、使用“time_nanosleep(延迟秒数,延迟纳秒数)”语句,可延迟执行函数若干秒和纳秒;3、使用“time_sleep_until(time()+7)”语句。

php字符串有没有下标php字符串有没有下标Apr 24, 2022 am 11:49 AM

php字符串有下标。在PHP中,下标不仅可以应用于数组和对象,还可应用于字符串,利用字符串的下标和中括号“[]”可以访问指定索引位置的字符,并对该字符进行读写,语法“字符串名[下标值]”;字符串的下标值(索引值)只能是整数类型,起始值为0。

php怎么除以100保留两位小数php怎么除以100保留两位小数Apr 22, 2022 pm 06:23 PM

php除以100保留两位小数的方法:1、利用“/”运算符进行除法运算,语法“数值 / 100”;2、使用“number_format(除法结果, 2)”或“sprintf("%.2f",除法结果)”语句进行四舍五入的处理值,并保留两位小数。

php怎么根据年月日判断是一年的第几天php怎么根据年月日判断是一年的第几天Apr 22, 2022 pm 05:02 PM

判断方法:1、使用“strtotime("年-月-日")”语句将给定的年月日转换为时间戳格式;2、用“date("z",时间戳)+1”语句计算指定时间戳是一年的第几天。date()返回的天数是从0开始计算的,因此真实天数需要在此基础上加1。

php怎么读取字符串后几个字符php怎么读取字符串后几个字符Apr 22, 2022 pm 08:31 PM

在php中,可以使用substr()函数来读取字符串后几个字符,只需要将该函数的第二个参数设置为负值,第三个参数省略即可;语法为“substr(字符串,-n)”,表示读取从字符串结尾处向前数第n个字符开始,直到字符串结尾的全部字符。

php怎么替换nbsp空格符php怎么替换nbsp空格符Apr 24, 2022 pm 02:55 PM

方法:1、用“str_replace(" ","其他字符",$str)”语句,可将nbsp符替换为其他字符;2、用“preg_replace("/(\s|\&nbsp\;||\xc2\xa0)/","其他字符",$str)”语句。

php怎么查找字符串是第几位php怎么查找字符串是第几位Apr 22, 2022 pm 06:48 PM

查找方法:1、用strpos(),语法“strpos("字符串值","查找子串")+1”;2、用stripos(),语法“strpos("字符串值","查找子串")+1”。因为字符串是从0开始计数的,因此两个函数获取的位置需要进行加1处理。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
2 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具