搜尋
首頁後端開發PHP問題php怎麼去除html並得到純文本

隨著網路的不斷發展和使用者需求的提高,越來越多的網站需要提供文字編輯功能,使用者可以在頁面上新增、編輯或刪除內容。這些內容在保存到資料庫或在頁面上展示時,通常需要經過一些處理,使它們成為純文字格式。

對於PHP程式設計師來說,去除HTML的過程也就是把一段富文本變成純文字格式的過程是重要的技能。那麼,如何使用PHP去除HTML並得到純文字呢?下面本文將就這個主題給出一些實用方法。

用strip_tags()函數去除HTML標籤

PHP中有一個strip_tags()函數,可以移除HTML標籤,得到純文字格式的字串。函數格式如下:

string strip_tags ( string $str [, string $allowable_tags ] )

第一個參數是要被處理的字串,第二個參數則是允許保留的標籤元素名稱。如果沒有指定第二個參數,則會移除所有HTML標籤。

例如,以下程式碼將會去掉HTML文字中所有的標籤元素,並輸出結果:

<?php     $html = &#39;<div><p>Hello, world!</p>';
    $text = strip_tags($html);
    echo $text; // 输出结果:Hello, world!
?>

可以將上述方法進行拓展,支援保留指定標籤元素。

<?php     $html = &#39;<div><p>Hello, world!</p><a>Google</a>';
    $text = strip_tags($html, '<p>');
    echo $text; // 输出结果:</p><p>Hello, world!</p>
?>

使用正規表示式移除HTML標籤

除了 strip_tags() 函數外,使用正規表示式也是常見的方法。正規表示式可以符合HTML標籤,並移除它們。以下是一段範例程式碼:

<?php     $html = &#39;<div><p>Hello, world!</p>';
    $text = preg_replace('/]*>/', '', $html);
    echo $text; // 输出结果:Hello, world!
?>

使用preg_replace()函數和正規表示式"/1*>/",移除了HTML標籤。這個正規表示式可以匹配任何以“”結束的字串,括號內的“^>”表示匹配除了“>”以外的所有字元。

實作更精細的HTML標籤移除

上述兩種方法雖然簡單有效,但會完全移除HTML標籤,包含一些格式標記,如粗體、斜體、底線等。如果不想完全移除這些標籤,而是只想保留它們的樣式,那該怎麼辦呢?

這時我們可以利用PHP DOM擴展,來實現更精細的HTML標籤去除。 PHP DOM擴展是一個功能強大且靈活的擴展,可以解析HTML、XML文檔,然後對它們進行操作,例如查詢、插入、刪除節點等。

以下是一段範例程式碼,利用PHP DOM擴充去除了HTML標籤:

<?php     $html = &#39;<div><p><strong>Hello, </strong><i>world</i>!</p>';
    
    $dom = new DOMDocument();
    $dom->loadHTML($html);

    $body = $dom->getElementsByTagName('body')->item(0);
    $text = $body->textContent;

    echo $text; // 输出结果:Hello, world!
?>

先建立一個DOMDocument對象,然後將要處理的HTML字串傳遞給它的loadHTML()方法。接著,使用getElementsByTagName('body')->item(0)方法來取得HTML中的body元素,然後使用textContent屬性,取得body元素下所有純文字內容。最後,將得到的結果輸出到螢幕上。

總結

本文介紹了三種以PHP為基礎的方法來移除HTML標記,得到純文字。第一種是簡單的strip_tags()函數,可以實現最基礎的HTML標記去除,第二種方法則利用正則表達式的優勢,對HTML標記進行匹配去除,第三種方法則使用PHP DOM擴展,可完全控制HTML體系,更精細的控制輸出結果。大家可以依照自己的需求,彈性選擇使用。


  1. >
#

以上是php怎麼去除html並得到純文本的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
酸與基本數據庫:差異和何時使用。酸與基本數據庫:差異和何時使用。Mar 26, 2025 pm 04:19 PM

本文比較了酸和基本數據庫模型,詳細介紹了它們的特徵和適當的用例。酸優先確定數據完整性和一致性,適合財務和電子商務應用程序,而基礎則側重於可用性和

PHP安全文件上傳:防止與文件相關的漏洞。PHP安全文件上傳:防止與文件相關的漏洞。Mar 26, 2025 pm 04:18 PM

本文討論了確保PHP文件上傳的確保,以防止諸如代碼注入之類的漏洞。它專注於文件類型驗證,安全存儲和錯誤處理以增強應用程序安全性。

PHP輸入驗證:最佳實踐。PHP輸入驗證:最佳實踐。Mar 26, 2025 pm 04:17 PM

文章討論了PHP輸入驗證以增強安全性的最佳實踐,重點是使用內置功能,白名單方法和服務器端驗證等技術。

PHP API率限制:實施策略。PHP API率限制:實施策略。Mar 26, 2025 pm 04:16 PM

本文討論了在PHP中實施API速率限制的策略,包括諸如令牌桶和漏水桶等算法,以及使用Symfony/Rate-limimiter之類的庫。它還涵蓋監視,動態調整速率限制和手

php密碼哈希:password_hash和password_verify。php密碼哈希:password_hash和password_verify。Mar 26, 2025 pm 04:15 PM

本文討論了使用password_hash和pyspasswify在PHP中使用密碼的好處。主要論點是,這些功能通過自動鹽,強大的哈希算法和SECH來增強密碼保護

OWASP前10 php:描述並減輕常見漏洞。OWASP前10 php:描述並減輕常見漏洞。Mar 26, 2025 pm 04:13 PM

本文討論了OWASP在PHP和緩解策略中的十大漏洞。關鍵問題包括注射,驗證損壞和XSS,並提供用於監視和保護PHP應用程序的推薦工具。

PHP XSS預防:如何預防XSS。PHP XSS預防:如何預防XSS。Mar 26, 2025 pm 04:12 PM

本文討論了防止PHP中XSS攻擊的策略,專注於輸入消毒,輸出編碼以及使用安全增強的庫和框架。

PHP接口與抽像類:何時使用。PHP接口與抽像類:何時使用。Mar 26, 2025 pm 04:11 PM

本文討論了PHP中接口和抽像類的使用,重點是何時使用。界面定義了無實施的合同,適用於無關類和多重繼承。摘要類提供常見功能

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器