在現代網站中常常會用到 HTML 標記,這些標記包含了各種元素,例如標題和段落等等。如果你是 PHP 開發者,那麼你可能會遇到這樣的需求:需要從 HTML 檔案中提取所有的標題和段落標記,以便進一步使用。這時候,正規表示式就派上用場了。本文將為你介紹如何使用 PHP 正規表示式來搭配 HTML 中的所有標題和段落。 首先,我們需要知道 HTML 中標題和段落的標記是什麼。 HTML 標記中包含了多種標題和段落元素,其中最常見的是 h1、h2、h3 等標記用於表示標題,而 p 標記則用於表示段落。在這篇文章中,我們將只關注這些最常用的標記。 現在,讓我們來看看如何使用 PHP 正規表示式來匹配 HTML 中的標題和段落標記。下面的程式碼展示了一個簡單的PHP 腳本,該腳本將讀取一個HTML 文件,並使用正規表示式來匹配其中的所有標題和段落:]*>(.*?)>/si'; preg_match_all($pattern, $html, $matches); // 显示所匹配的结果 print_r($matches[0]); ?>這個程式碼片段中的正則表達式/143322b74fd52f09c9c5bcbdc0028c95]*>(.*?)0468589710c60a96e6cf456cf4fedd26/si 可以做到以下幾件事: c46814b40bf684aa66e0bd9d8912b58b 元字元用於匹配HTML 標記的起始和結束位置。 hd|p 表示符合所有標題(h1、h2、h3 等)和段落(p)標記。 [^>]* 匹配標記中除了> 之外的所有字符,這是因為> 是標記起始位置的定界符。 (.*?) 使用非貪婪匹配方式來匹配標記中間的文字。 0468589710c60a96e6cf456cf4fedd26 表示匹配與起始標記相對應的結束標記。 表示符合前面指定的標記(即 hd|p)。 在這個正規表示式中,我們使用了 s 和 i 兩個模式修飾符。其中,s 用於開啟“點號匹配模式”,使得 . 元字符匹配所有字符,包括換行符。而 i 用於開啟“不區分大小寫模式”,使得標記名的大小寫不影響匹配結果。 當腳本運行完成後,它會將所有匹配到的標題和段落標記列印出來。這個結果將類似於下面這樣:Array ( [0] => PHP 正则表达式 [1] => 现代网站中常常会用到 HTML 标记,这些标记包含了各种元素,例如标题和段落等等。 [2] => 标题2 [3] => 段落2 [4] => 标题3 [5] => 段落3 )透過這個結果,我們可以看到 PHP 正規表示式成功地匹配了 HTML 中的所有標題和段落標記。這個正規表示式還有其他的應用場景,例如符合 HTML 中的連結、圖片和表格等。希望這篇文章可以幫助你更好地理解使用 PHP 正規表示式來匹配 HTML 中的元素。