ホームページ  >  記事  >  Java  >  Javaを使用してHTMLタグを削除する方法

Javaを使用してHTMLタグを削除する方法

醉折花枝作酒筹
醉折花枝作酒筹オリジナル
2021-06-08 15:44:473185ブラウズ

在java中,可以使用replaceAll方法去除html标签,语法格式为“replaceAll(匹配此字符串的正则表达式,"")”。“replaceAll()”方法使用给定的参数替换字符串所有匹配给定的正则表达式的子字符串。

Javaを使用してHTMLタグを削除する方法

本教程操作环境:windows7系统、java10版、Dell G3电脑。

public static String stripHtml(String content) { 
// <p>段落替换为换行 
content = content.replaceAll("<p .*?>", "\r\n"); 
// <br><br/>替换为换行 
content = content.replaceAll("<br\\s*/?>", "\r\n"); 
// 去掉其它的<>之间的东西 
content = content.replaceAll("\\<.*?>", ""); 
// 还原HTML 
// content = HTMLDecoder.decode(content); 
return content; 
}

扩展资料:

replaceAll() 方法使用给定的参数 replacement 替换字符串所有匹配给定的正则表达式的子字符串。

语法

public String replaceAll(String regex, String replacement)

参数

  • regex -- 匹配此字符串的正则表达式。

  • replacement -- 用来替换每个匹配项的字符串。

返回值

成功则返回替换的字符串,失败则返回原始字符串。

相关免费学习推荐:java基础教程

以上がJavaを使用してHTMLタグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。