首頁 >後端開發 >C++ >如何使用正規表示式高效刪除所有HTML標籤?

如何使用正規表示式高效刪除所有HTML標籤?

Mary-Kate Olsen
Mary-Kate Olsen原創
2025-01-06 04:47:39297瀏覽

How Can I Efficiently Remove All HTML Tags Using Regular Expressions?

正規表示式有效刪除 HTML 標籤

嘗試使用正規表示式刪除 HTML 標籤時,解決遺留問題至關重要結束標籤。本文為這項挑戰提供了一個有效的解決方案。

提供的程式碼:

string sPattern = @"<\/?!?(img|a)[^>]*>";
Regex rgx = new Regex(sPattern);

嘗試刪除第一次出現的 如何使用正規表示式高效刪除所有HTML標籤?標籤,但無法消除結束標籤。

要獲得所需的結果,應如下修改正規表示式:

string sPattern = @"<\/?[^>]*>";

此更新後的模式符合任何HTML 標籤,無論其是什麼類型,並將刪除開始和結束標記。

此外,可以透過使用Trim 和Replace 等字串方法來簡化提供的程式碼,如下:

string removeTags(string input)
{
    return input.Replace("<[^>]*>", "")
                .Replace("\s+", " ")
                .Trim();
}

此函數可有效刪除所有HTML 標籤,並以單一空格替換多個空格,並修剪任何前導或尾隨空格。

以上是如何使用正規表示式高效刪除所有HTML標籤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn