在網頁開發中,HTML 是不可或缺的元素。但是有時候我們需要從 HTML 中提取純文字而不帶有 HTML 標記。這時候,正規表示式就是一個很方便的工具。
在 PHP 中,可以使用 preg_replace() 函數來刪除 HTML 標記。此函數的用法如下:
preg_replace($pattern, $replacement, $subject);
其中,$pattern 是正規表示式模式,$replacement 是替換字串,$subject 是待處理的字串。請注意,$pattern 和 $replacement 都可以是數組,這在下文中會涉及。
接下來,我們將討論幾個常見的刪除 HTML 標籤的正規表示式。
$pattern = '/<[^>]*>/'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
在這個正規表示式中,dabe915ad875b11b81ff5426d840bf67 標記的文本,並將其刪除。 (?s) 標記表示 . 符合任何字符,包括換行符。這個表達式還是非貪婪的,因為它使用了 *?,這將匹配盡可能少的字元。
$pattern = '/<style[^>]*>(.*?)</style>/is'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
$pattern = '/<([a-z]+)(?:s+[^>]+)?>(s*)</>/i'; $replacement = ''; $text = preg_replace($pattern, $replacement, $html);
$pattern = '/>s+</'; $replacement = '><'; $text = preg_replace($pattern, $replacement, $html);
以上是如何使用正規表示式在 PHP 中刪除 HTML 標記的詳細內容。更多資訊請關注PHP中文網其他相關文章!