正規表示式有效刪除 HTML 標籤
嘗試使用正規表示式刪除 HTML 標籤時,解決遺留問題至關重要結束標籤。本文為這項挑戰提供了一個有效的解決方案。
提供的程式碼:
string sPattern = @"<\/?!?(img|a)[^>]*>"; Regex rgx = new Regex(sPattern);
嘗試刪除第一次出現的 和 標籤,但無法消除結束標籤。
要獲得所需的結果,應如下修改正規表示式:
string sPattern = @"<\/?[^>]*>";
此更新後的模式符合任何HTML 標籤,無論其是什麼類型,並將刪除開始和結束標記。
此外,可以透過使用Trim 和Replace 等字串方法來簡化提供的程式碼,如下:
string removeTags(string input) { return input.Replace("<[^>]*>", "") .Replace("\s+", " ") .Trim(); }
此函數可有效刪除所有HTML 標籤,並以單一空格替換多個空格,並修剪任何前導或尾隨空格。
以上是如何使用正規表示式高效刪除所有HTML標籤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!