正则表达式高效删除 HTML 标签
尝试使用正则表达式删除 HTML 标签时,解决遗留问题至关重要结束标签。本文为这一挑战提供了一个有效的解决方案。
提供的代码:
string sPattern = @"<\/?!?(img|a)[^>]*>"; Regex rgx = new Regex(sPattern);
尝试删除第一次出现的 和 标签,但无法消除结束标签。
要获得所需的结果,应按如下方式修改正则表达式:
string sPattern = @"<\/?[^>]*>";
此更新后的模式匹配任何 HTML 标签,无论其是什么类型,并将删除开始和结束标记。
此外,可以通过使用 Trim 和 Replace 等字符串方法来简化提供的代码,如以下:
string removeTags(string input) { return input.Replace("<[^>]*>", "") .Replace("\s+", " ") .Trim(); }
此函数可有效删除所有 HTML 标签,用单个空格替换多个空格,并修剪任何前导或尾随空格。
以上是如何使用正则表达式高效删除所有HTML标签?的详细内容。更多信息请关注PHP中文网其他相关文章!