首頁 >後端開發 >php教程 >php正規表示式

php正規表示式

WBOY
WBOY原創
2016-08-08 09:20:07909瀏覽

什麼叫正規表示式

正規表示式是對字串進行操作的一種邏輯公式,就是用一些特定的字元組合成一個規則字串,稱之為正規匹配模式。

$p = '/apple/'; $str = "apple banna"; if (preg_match($p, $str)) { echo 'matched'; }

其中字串'/apple/'就是一個正規表示式,他用來匹配來源字串中是否存在apple字串。

PHP中使用PCRE函式庫函數進行正規匹配,例如上例中的preg_match用於執行一個正規匹配,常用來判斷一類字元模式是否存在。

正規表示式的基本語法

PCRE函式庫函數中,正規匹配模式使用分隔符號與元字元組成,分隔符號可以是非數字、非反斜線、非空格的任意字元。常用的分隔符號是正斜線(/)、hash符號(#) 以及取反符號(~),例如:

/foo bar/ #^[^0-9]$# ~php~

如果模式中包含分隔符,則分隔符需要使用反斜線()進行轉義。

/http:\/\//

如果模式中包含較多的分割字符,建議更換其他的字符作為分隔符,也可以採用preg_quote進行轉義。

$p = 'http://'; $p = '/'.preg_quote($p, '/').'/'; echo $p;

分隔符後面可以使用模式修飾符,模式修飾符包括:i, m, s, x等,例如使用i修飾符可以忽略大小寫匹配:

$str = "Http://www.imooc.com/"; if (preg_match('/http/i', $str)) { echo '匹配成功'; }

元與轉義

正則表達式中具有特殊含義的字符稱之為元字符,常用的元字符有:

一般用於轉義字符^ 斷言目標的開始位置(或在多行模式下是行首)
$ 斷言目標的結束位置(或在多行模式下是行尾)
. 匹配除換行符外的任何字元(預設)
[ 開始字元類別定義
] 結束字元類別定義
| 開始一個可選分支
( 子組的開始標記
) 子組的結束標記
? 作為量詞,表示0 次或1 次匹配。位於量詞後面用來改變量詞的貪婪特性。 (查閱量詞)
* 量詞,0 次或多次匹配
+ 量詞,1 次或多次匹配
{ 自訂量詞開始標記
} 自訂量詞結束標記
//下面的\s匹配任意的空白符,包括空格,制表符,换行符。[^\s]代表非空白符。[^\s]+表示一次或多次匹配非空白符。 $p = '/^我[^\s]+(苹果|香蕉)$/'; $str = "我喜欢吃苹果"; if (preg_match($p, $str)) { echo '匹配成功'; }

元字符具有兩種使用場景,一種是可以在任何地方都能使用,另一種是只能在方括號內使用,在方括號內使用的有:

轉義字符^ 僅在作為第一個字符(方括號內)時,表示字元類別取反
- 標記字元範圍

其中^在反括號外面,表示斷言目標的開始位置,但在方括號內部則代表字元類取反,方括號內的減號-可以標記字元範圍,例如0-9表示0到9之間的所有數字。 //下面的\w匹配字母或数字或下划线。 $p = '/[\w\.\-]+@[a-z0-9\-]+\.(com|cn)/'; $str = "我的邮箱是Spark.eric@imooc.com"; preg_match($p, $str, $match); echo $match[0];

貪婪模式與懶惰模式

正則表達式中每個元字符匹配一個字符,當使用+之後將會變的貪婪,它將匹配一個字符,但盡可能多的字符,但盡可能多的字符使用問號?字符時,它將盡可能少的匹配字符,既是懶惰模式。

貪婪模式:在可匹配與可不匹配的時候,優先匹配//下面的\d表示匹配数字 $p = '/\d+\-\d+/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:010-12345678

懶惰模式:在可匹配與可不匹配的時候,優先匹配$p = '/\d?\-\d?/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:0-1

的字元長度的時候,可以使用{}指定匹配字元數

$p = '/\d{3}\-\d{8}/'; $str = "我的电话是010-12345678"; preg_match($p, $str, $match); echo $match[0]; //结果为:010-12345678

使用正則表達式進行匹配

使用正則表達式的目的是為了實現比函數處理函數更加靈活的處理方式,因此跟字串處理函數一樣,其主要用來判斷子字串是否存在、字串替換、分割字串、取得模式子字串等。

PHP使用PCRE函式庫函數來進行正規處理,透過設定好模式,然後呼叫相關的處理函數來取得匹配結果。

preg_match用來執行一個匹配,可以簡單的用來判斷模式是否匹配成功,或者取得一個匹配結果,他的返回值是匹配成功的次數0或者1,在匹配到1次以後就會停止搜尋.

$subject = "abcdef"; $pattern = '/def/'; preg_match($pattern, $subject, $matches); print_r($matches); //结果为:Array ( [0] => def )上面的程式碼簡單的執行了一個匹配,簡單的判斷def是否能匹配成功,但是正則表達式的強大的地方是進行模式匹配,因此更多的時候,會使用模式:

$subject = "abcdef"; $pattern = '/a(.*?)d/'; preg_match($pattern, $subject, $matches); print_r($matches); //结果为:Array ( [0] => abcd [1] => bc ) 透過正規表示式可以匹配一個模式,得到更多有用的資料。

🎜

查找所有匹配结果

preg_match只能匹配一次结果,但很多时候我们需要匹配所有的结果,preg_match_all可以循环获取一个列表的匹配结果数组。

$p = "|<[^>]+>(.*?)]+>|i"; $str = "example:
this is a test
"; preg_match_all($p, $str, $matches); print_r($matches);

可以使用preg_match_all匹配一个表格中的数据:

$p = "/(.*?)<\/td>\s*(.*?)<\/td>\s*<\/tr>/i"; $str = "
Eric25
John26
"; preg_match_all($p, $str, $matches); print_r($matches);

$matches结果排序为$matches[0]保存完整模式的所有匹配, $matches[1] 保存第一个子组的所有匹配,以此类推。

正则表达式的搜索和替换

正则表达式的搜索与替换在某些方面具有重要用途,比如调整目标字符串的格式,改变目标字符串中匹配字符串的顺序等。

例如我们可以简单的调整字符串的日期格式:

$string = 'April 15, 2014'; $pattern = '/(\w+) (\d+), (\d+)/i'; $replacement = '$3, ${1} $2'; echo preg_replace($pattern, $replacement, $string); //结果为:2014, April 15

其中${1}与$1的写法是等效的,表示第一个匹配的字串,$2代表第二个匹配的。

通过复杂的模式,我们可以更加精确的替换目标字符串的内容。

$patterns = array ('/(19|20)(\d{2})-(\d{1,2})-(\d{1,2})/', '/^\s*{(\w+)}\s*=/'); $replace = array ('\3/\4/\1\2', '$\1 =');//\3等效于$3,\4等效于$4,依次类推 echo preg_replace($patterns, $replace, '{startDate} = 1999-5-27'); //结果为:$startDate = 5/27/1999 //详细解释下结果:(19|20)表示取19或者20中任意一个数字,(\d{2})表示两个数字,(\d{1,2})表示1个或2个数字,(\d{1,2})表示1个或2个数字。^\s*{(\w+)\s*=}表示以任意空格开头的,并且包含在{}中的字符,并且以任意空格结尾的,最后有个=号的。

用正则替换来去掉多余的空格与字符:

$str = 'one two'; $str = preg_replace('/\s+/', ' ', $str); echo $str; // 结果改变为'one two'

正则匹配常用案例

正则匹配常用在表单验证上,一些字段会有一定的格式要求,比如用户名一般都要求必须是字母、数字或下划线组成,邮箱、电话等也都有自己的规则,因此使用正则表达式可以很好的对这些字段进行验证。

版权声明:本文为博主原创文章,未经博主允许不得转载。

以上就介绍了php正则表达式,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn