什麼叫正規表示式
正規表示式是對字串進行操作的一種邏輯公式,就是用一些特定的字元組合成一個規則字串,稱之為正規匹配模式。
其中字串'/apple/'就是一個正規表示式,他用來匹配來源字串中是否存在apple字串。
PHP中使用PCRE函式庫函數進行正規匹配,例如上例中的preg_match用於執行一個正規匹配,常用來判斷一類字元模式是否存在。
正規表示式的基本語法
PCRE函式庫函數中,正規匹配模式使用分隔符號與元字元組成,分隔符號可以是非數字、非反斜線、非空格的任意字元。常用的分隔符號是正斜線(/)、hash符號(#) 以及取反符號(~),例如:
如果模式中包含分隔符,則分隔符需要使用反斜線()進行轉義。
如果模式中包含較多的分割字符,建議更換其他的字符作為分隔符,也可以採用preg_quote進行轉義。
分隔符後面可以使用模式修飾符,模式修飾符包括:i, m, s, x等,例如使用i修飾符可以忽略大小寫匹配:
元與轉義
正則表達式中具有特殊含義的字符稱之為元字符,常用的元字符有:
一般用於轉義字符^ 斷言目標的開始位置(或在多行模式下是行首)
$ 斷言目標的結束位置(或在多行模式下是行尾)
. 匹配除換行符外的任何字元(預設)
[ 開始字元類別定義
] 結束字元類別定義
| 開始一個可選分支
( 子組的開始標記
) 子組的結束標記
? 作為量詞,表示0 次或1 次匹配。位於量詞後面用來改變量詞的貪婪特性。 (查閱量詞)
* 量詞,0 次或多次匹配
+ 量詞,1 次或多次匹配
{ 自訂量詞開始標記
} 自訂量詞結束標記
元字符具有兩種使用場景,一種是可以在任何地方都能使用,另一種是只能在方括號內使用,在方括號內使用的有:
轉義字符^ 僅在作為第一個字符(方括號內)時,表示字元類別取反
- 標記字元範圍
其中^在反括號外面,表示斷言目標的開始位置,但在方括號內部則代表字元類取反,方括號內的減號-可以標記字元範圍,例如0-9表示0到9之間的所有數字。
貪婪模式與懶惰模式
正則表達式中每個元字符匹配一個字符,當使用+之後將會變的貪婪,它將匹配一個字符,但盡可能多的字符,但盡可能多的字符使用問號?字符時,它將盡可能少的匹配字符,既是懶惰模式。
貪婪模式:在可匹配與可不匹配的時候,優先匹配
懶惰模式:在可匹配與可不匹配的時候,優先匹配
的字元長度的時候,可以使用{}指定匹配字元數
使用正則表達式進行匹配
使用正則表達式的目的是為了實現比函數處理函數更加靈活的處理方式,因此跟字串處理函數一樣,其主要用來判斷子字串是否存在、字串替換、分割字串、取得模式子字串等。
PHP使用PCRE函式庫函數來進行正規處理,透過設定好模式,然後呼叫相關的處理函數來取得匹配結果。
preg_match用來執行一個匹配,可以簡單的用來判斷模式是否匹配成功,或者取得一個匹配結果,他的返回值是匹配成功的次數0或者1,在匹配到1次以後就會停止搜尋.
查找所有匹配结果
preg_match只能匹配一次结果,但很多时候我们需要匹配所有的结果,preg_match_all可以循环获取一个列表的匹配结果数组。
可以使用preg_match_all匹配一个表格中的数据:
Eric | 25 |
John | 26 |
$matches结果排序为$matches[0]保存完整模式的所有匹配, $matches[1] 保存第一个子组的所有匹配,以此类推。
正则表达式的搜索和替换
正则表达式的搜索与替换在某些方面具有重要用途,比如调整目标字符串的格式,改变目标字符串中匹配字符串的顺序等。
例如我们可以简单的调整字符串的日期格式:
其中${1}与$1的写法是等效的,表示第一个匹配的字串,$2代表第二个匹配的。
通过复杂的模式,我们可以更加精确的替换目标字符串的内容。
用正则替换来去掉多余的空格与字符:
正则匹配常用案例
正则匹配常用在表单验证上,一些字段会有一定的格式要求,比如用户名一般都要求必须是字母、数字或下划线组成,邮箱、电话等也都有自己的规则,因此使用正则表达式可以很好的对这些字段进行验证。
版权声明:本文为博主原创文章,未经博主允许不得转载。
以上就介绍了php正则表达式,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。