PHP中正規表示式實例詳解-php教程-PHP中文網

首頁

後端開發

php教程

PHP中正規表示式實例詳解

墨辰丷

May 23, 2018 pm 03:04 PM

php表達式詳解

在编程里基本都会用到正则表达式来处理数据，那么下面就具体在PHP中怎么运用吧，本文通过具体的实例，给大家讲解了PHP中正则表达式的使用方法。

最近使用 PHP 写了一个应用，主要是正则表达式的处理，趁机系统性的学习了相应知识。
这篇文章的写作方式不是讲理论，而是通过具体的例子来了解正则，这样也更有实践性，在此基础上再去看正则表达式的基本概念会更有收获。

禁止分组的捕获

在正则中分组很有用，可以定义子模式，然后可以通过后向引用来引用分组的内容，但是有的时候仅仅想通过分组来进行范围定义，而不想被分组来捕获，通过一个例子就能明白：

$str = "http://www.google.com";
$preg= "/http:\/\/\w+\.\w+.(?:net|com|cn)+/is";
$preg2= "/http:\/\/\w+\.\w+.(net|com|cn)+/is";
preg_match($preg,$str,$arr);
preg_match($preg2,$str,$arr2);

当模式中出现?:表示这个括号的分组不会被引用，运行下例子就能明白。

preg_match() 和 preg_match_all() 的区别

preg_match() 在匹配模式的时候匹配到一次就结束，而 preg_match_all() 则进行全局匹配，通过一个例子就能明白：

$str=&#39;hello world china&#39;;
$preg="/\w+\s/is";
preg_match($preg,$str,$arr);
print_r($arr);
preg_match_all($preg,$str,$arr);
print_r($arr);

正确理解 $ 和 ^

先说一个正则，为了匹配是否是手机号:

$str = "13521899942a";
$preg="/1[\d]{3,15}/is";
if (preg_match($preg,$str,$arr)) {
  echo "ok";
}

虽然字符串中有一个英文字母，但是这个子模式却匹配了，原因就在于模式匹配到后就结束了，不会再去寻找英文字母，为了解决这问题 $ 和 ^ 就发挥作用了，比如让字符串的开始和结尾必须匹配一定的模式，修改如下：

$str = "13521899942a";
$preg="/1[\d]{3,15}$/is";
if (preg_match($preg,$str,$arr)) {
  echo "ok";
}

$ 和 ^ 的跨行模式

默认的情况下，$ 和 ^ 只会匹配完整段落的开始和结尾，但是通过改变选项，允许匹配文本的每一行的开始和结尾，通过下面的例子就能明白

$str=&#39;hello
world&#39;;
$preg=&#39;/\w+$/ism&#39;;//$preg=&#39;/(?m)\w+$/is&#39;;
preg_match_all($preg,$str,$arr);
print_r($arr);

分组命名

在正则中通过括号分组后，可以使用 \1,\2 这样的数字进行后向引用，但是假如正则中模式太多，在使用的时候就会比较混乱，这时候可以采用分组命名来进行引用，看个例子：

$str ="email:ywdblog@gmail.com;";
preg_match("/email:(?<email>\w+?)/is", $str, $matches);
echo $matches["email"] . "_" . $matches[&#39;no&#39;];

懒惰模式

正则在匹配的时候是贪婪的，只要符合模式就会一直匹配下去，下面的例子，匹配到的文本是

hello

world

$str = "<h2 id="hello">hello</h2><h2 id="world">world</h2>";
$preg = "/<h2>.*<\/h2>/is";
preg_match($preg,$str,$arr);
print_r($arr);

通过改变一个选项可以修改为懒惰模式，就是一旦匹配到就中止，修改代码如下：

$str = "<h2 id="hello">hello</h2><h2 id="world">world</h2>";
$preg = "/<h2>.*?<\/h2>/is";
preg_match($preg,$str,$arr);
print_r($arr);

进一步理解 preg_match_all()

通过这函数的最后一个参数，能够返回不同形式的数组：

$str= &#39;jiangsu (nanjing) nantong
guangdong (guangzhou) zhuhai
beijing (tongzhou) haidian&#39;;
$preg = &#39;/^\s*+([^(]+?)\s\(([^)]+)\)\s+(.*)$/m&#39;;
preg_match_all($preg,$str,$arr,PREG_PATTERN_ORDER);
print_r($arr);
preg_match_all($preg,$str,$arr,PREG_SET_ORDER);
print_r($arr);

强大的正则替换回调

虽然 preg_replace() 函数能完成大多数的替换，但是假如你想更好的控制，可以使用回调，不用多说看例子：

$str = "china hello world";
$preg = &#39;/\b(\w+)(\w)\b/&#39;;
function fun($m){
    return $m[1].strtoupper($m[2]);
}
echo preg_replace_callback($preg,"fun",$str);

在这一点上，PHP 比 Python 强大的多，Python 中没有正则回调，不过可以使用闭包的方式解决，可看我以前的文章。

preg_quote()

这个函数类似于 Python 中的 re.compile() 函数，假如在模式中一些元字符仅仅想表达字符的本身含义，可以转义，但是假如在模式中写太多的转义，会显得很混乱，可以使用这个函数来统一转义：

$str = &#39;\\*china*world&#39;;
$preg = "\*china";
$preg = preg_quote($preg);
echo $preg;
preg_match( "/{$preg}/is",$str,$arr);
print_r($arr);

向前查找 ?= 的妙用

用英文解释可能比较贴切：

The "?=" combination means "the next text must be like this". This construct doesn't capture the text.
（1）这个例子可以获取 URL 中的协议部分，比如 https,ftp，注意 ?: 后面的部分不在返回的内容中。

$str = "http://www.google.com";
$str = "https://www.google.com";
$preg = &#39;/[a-z]+(?=:)/&#39;;
preg_match($preg,$str,$arr);
print_r($arr);

（2）"invisible" 分隔符

也叫 “zero-width” 分隔符，参考下面的例子：

$str = ("chinaWorldHello");
$preg = "/(?=[A-Z])/";
$arr = preg_split($preg,$str);
print_r($arr);

（3）匹配强密码

instead of specifying the order that things should appear, it's saying that it must appear but we're not worried about the order.
The first grouping is (?=.{8,}). This checks if there are at least 8 characters in the string. The next grouping (?=.[0-9]) means "any alphanumeric character can happen zero or more times, then any digit can happen". So this checks if there is at least one number in the string. But since the string isn't captured, that one digit can appear anywhere in the string. The next groupings (?=.[a-z]) and (?=.[A-Z]) are looking for the lower case and upper case letter accordingly anywhere in the string.

$str= "HelloWorld2016";
if (preg_match("/^.*(?=.{8,})(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).*$/", $str,$arr)){
  print_r($arr);
}

向后查找 ?

??= 表示假如匹配到特定字符，则返回该字符前面的内容。

$str = &#39;chinadhello&#39;;
$preg = &#39;/(?<=a)d(?=h)/&#39;;  
preg_match($preg, $str, $arr);
print_r($arr);

以上就是本文的全部内容，希望对大家的学习有所帮助。

相关推荐：

PHP的PDO常用类库实例分析_php技巧

非常有用的9个PHP代码片段_php技巧

thinkphp框架下实现登录、注册、找回密码功能_php技巧

以上是PHP中正規表示式實例詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

超越炒作：評估當今PHP的角色Apr 12, 2025 am 12:17 AM

PHP在現代編程中仍然是一個強大且廣泛使用的工具，尤其在web開發領域。 1)PHP易用且與數據庫集成無縫，是許多開發者的首選。 2)它支持動態內容生成和麵向對象編程，適合快速創建和維護網站。 3)PHP的性能可以通過緩存和優化數據庫查詢來提升，其廣泛的社區和豐富生態系統使其在當今技術棧中仍具重要地位。

PHP中的弱參考是什麼？什麼時候有用？Apr 12, 2025 am 12:13 AM

在PHP中，弱引用是通過WeakReference類實現的，不會阻止垃圾回收器回收對象。弱引用適用於緩存系統和事件監聽器等場景，需注意其不能保證對象存活，且垃圾回收可能延遲。

解釋PHP中的__ Invoke Magic方法。Apr 12, 2025 am 12:07 AM

\_\_invoke方法允許對象像函數一樣被調用。 1.定義\_\_invoke方法使對象可被調用。 2.使用$obj(...)語法時，PHP會執行\_\_invoke方法。 3.適用於日誌記錄和計算器等場景，提高代碼靈活性和可讀性。

解釋PHP 8.1中的纖維以進行並發。Apr 12, 2025 am 12:05 AM

Fibers在PHP8.1中引入，提升了並發處理能力。 1)Fibers是一種輕量級的並發模型，類似於協程。 2)它們允許開發者手動控制任務的執行流，適合處理I/O密集型任務。 3)使用Fibers可以編寫更高效、響應性更強的代碼。

PHP社區：資源，支持和發展Apr 12, 2025 am 12:04 AM

PHP社區提供了豐富的資源和支持，幫助開發者成長。 1)資源包括官方文檔、教程、博客和開源項目如Laravel和Symfony。 2)支持可以通過StackOverflow、Reddit和Slack頻道獲得。 3)開發動態可以通過關注RFC了解。 4)融入社區可以通過積極參與、貢獻代碼和學習分享來實現。