首页 >Java >Java基础 >如何使用java去除html标签

如何使用java去除html标签

醉折花枝作酒筹
醉折花枝作酒筹原创
2021-06-08 15:44:473322浏览

在java中,可以使用replaceAll方法去除html标签,语法格式为“replaceAll(匹配此字符串的正则表达式,"")”。“replaceAll()”方法使用给定的参数替换字符串所有匹配给定的正则表达式的子字符串。

如何使用java去除html标签

本教程操作环境:windows7系统、java10版、Dell G3电脑。

public static String stripHtml(String content) { 
// <p>段落替换为换行 
content = content.replaceAll("<p .*?>", "\r\n"); 
// <br><br/>替换为换行 
content = content.replaceAll("<br\\s*/?>", "\r\n"); 
// 去掉其它的<>之间的东西 
content = content.replaceAll("\\<.*?>", ""); 
// 还原HTML 
// content = HTMLDecoder.decode(content); 
return content; 
}

扩展资料:

replaceAll() 方法使用给定的参数 replacement 替换字符串所有匹配给定的正则表达式的子字符串。

语法

public String replaceAll(String regex, String replacement)

参数

  • regex -- 匹配此字符串的正则表达式。

  • replacement -- 用来替换每个匹配项的字符串。

返回值

成功则返回替换的字符串,失败则返回原始字符串。

相关免费学习推荐:java基础教程

以上是如何使用java去除html标签的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn