Java verwendet reguläre Ausdrücke, um HTML-Tags zu filtern-javaLernprogramm-php.cn

Heim

Java

javaLernprogramm

Java verwendet reguläre Ausdrücke, um HTML-Tags zu filtern

高洛峰

Jan 22, 2017 am 11:54 AM

前段时间开发的时候要读取一篇文章的简介内容（也就是前200个字符），使用了隐藏字段，可能有人就要问了，那后台也是可以截取字符的啊，那是因为编辑器里面包含了html标签，所以后台就需要处理html标签的正则表达式，前些天上网搜了下，发现有人写好的一个类，给大家共享下

import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
  
/** 
 * <p> 
 * Title: HTML相关的正则表达式工具类 
 * </p> 
 * <p> 
 * Description: 包括过滤HTML标记，转换HTML标记，替换特定HTML标记 
 * </p> 
 * <p> 
 * Copyright: Copyright (c) 2006 
 * </p> 
 * 
 * @author hejian 
 * @version 1.0 
 * @createtime 2006-10-16 
 */
  
public class HtmlRegexpUtil { 
 private final static String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签 
  
 private final static String regxpForImgTag = "<\\s*img\\s+([^>]*)\\s*>"; // 找出IMG标签 
  
 private final static String regxpForImaTagSrcAttrib = "src=\"([^\"]+)\""; // 找出IMG标签的SRC属性 
  
 /** 
  * 
  */
 public HtmlRegexpUtil() { 
  // TODO Auto-generated constructor stub 
 } 
  
 /** 
  * 
  * 基本功能：替换标记以正常显示 
  * <p> 
  * 
  * @param input 
  * @return String 
  */
 public String replaceTag(String input) { 
  if (!hasSpecialChars(input)) { 
   return input; 
  } 
  StringBuffer filtered = new StringBuffer(input.length()); 
  char c; 
  for (int i = 0; i <= input.length() - 1; i++) { 
   c = input.charAt(i); 
   switch (c) { 
   case &#39;<&#39;: 
    filtered.append("<"); 
    break; 
   case &#39;>&#39;: 
    filtered.append(">"); 
    break; 
   case &#39;"&#39;: 
    filtered.append("""); 
    break; 
   case &#39;&&#39;: 
    filtered.append("&"); 
    break; 
   default: 
    filtered.append(c); 
   } 
  
  } 
  return (filtered.toString()); 
 } 
  
 /** 
  * 
  * 基本功能：判断标记是否存在 
  * <p> 
  * 
  * @param input 
  * @return boolean 
  */
 public boolean hasSpecialChars(String input) { 
  boolean flag = false; 
  if ((input != null) && (input.length() > 0)) { 
   char c; 
   for (int i = 0; i <= input.length() - 1; i++) { 
    c = input.charAt(i); 
    switch (c) { 
    case &#39;>&#39;: 
     flag = true; 
     break; 
    case &#39;<&#39;: 
     flag = true; 
     break; 
    case &#39;"&#39;: 
     flag = true; 
     break; 
    case &#39;&&#39;: 
     flag = true; 
     break; 
    } 
   } 
  } 
  return flag; 
 } 
  
 /** 
  * 
  * 基本功能：过滤所有以"<"开头以">"结尾的标签 
  * <p> 
  * 
  * @param str 
  * @return String 
  */
 public static String filterHtml(String str) { 
  Pattern pattern = Pattern.compile(regxpForHtml); 
  Matcher matcher = pattern.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result1 = matcher.find(); 
  while (result1) { 
   matcher.appendReplacement(sb, ""); 
   result1 = matcher.find(); 
  } 
  matcher.appendTail(sb); 
  return sb.toString(); 
 } 
  
 /** 
  * 
  * 基本功能：过滤指定标签 
  * <p> 
  * 
  * @param str 
  * @param tag 
  *   指定标签 
  * @return String 
  */
 public static String fiterHtmlTag(String str, String tag) { 
  String regxp = "<\\s*" + tag + "\\s+([^>]*)\\s*>"; 
  Pattern pattern = Pattern.compile(regxp); 
  Matcher matcher = pattern.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result1 = matcher.find(); 
  while (result1) { 
   matcher.appendReplacement(sb, ""); 
   result1 = matcher.find(); 
  } 
  matcher.appendTail(sb); 
  return sb.toString(); 
 } 
  
 /** 
  * 
  * 基本功能：替换指定的标签 
  * <p> 
  * 
  * @param str 
  * @param beforeTag 
  *   要替换的标签 
  * @param tagAttrib 
  *   要替换的标签属性值 
  * @param startTag 
  *   新标签开始标记 
  * @param endTag 
  *   新标签结束标记 
  * @return String 
  * @如：替换img标签的src属性值为[img]属性值[/img] 
  */
 public static String replaceHtmlTag(String str, String beforeTag, 
   String tagAttrib, String startTag, String endTag) { 
  String regxpForTag = "<\\s*" + beforeTag + "\\s+([^>]*)\\s*>"; 
  String regxpForTagAttrib = tagAttrib + "=\"([^\"]+)\""; 
  Pattern patternForTag = Pattern.compile(regxpForTag); 
  Pattern patternForAttrib = Pattern.compile(regxpForTagAttrib); 
  Matcher matcherForTag = patternForTag.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  boolean result = matcherForTag.find(); 
  while (result) { 
   StringBuffer sbreplace = new StringBuffer(); 
   Matcher matcherForAttrib = patternForAttrib.matcher(matcherForTag 
     .group(1)); 
   if (matcherForAttrib.find()) { 
    matcherForAttrib.appendReplacement(sbreplace, startTag 
      + matcherForAttrib.group(1) + endTag); 
   } 
   matcherForTag.appendReplacement(sb, sbreplace.toString()); 
   result = matcherForTag.find(); 
  } 
  matcherForTag.appendTail(sb); 
  return sb.toString(); 
 } 
}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持PHP中文网。

更多java使用正则表达式过滤html标签相关文章请关注PHP中文网！

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Wie benutze ich Maven oder Gradle für das fortschrittliche Java -Projektmanagement, die Erstellung von Automatisierung und Abhängigkeitslösung?Mar 17, 2025 pm 05:46 PM

In dem Artikel werden Maven und Gradle für Java -Projektmanagement, Aufbau von Automatisierung und Abhängigkeitslösung erörtert, die ihre Ansätze und Optimierungsstrategien vergleichen.

Wie erstelle und verwende ich benutzerdefinierte Java -Bibliotheken (JAR -Dateien) mit ordnungsgemäßem Versioning und Abhängigkeitsmanagement?Mar 17, 2025 pm 05:45 PM

In dem Artikel werden benutzerdefinierte Java -Bibliotheken (JAR -Dateien) mit ordnungsgemäßem Versioning- und Abhängigkeitsmanagement erstellt und verwendet, wobei Tools wie Maven und Gradle verwendet werden.

Wie implementiere ich mehrstufige Caching in Java-Anwendungen mit Bibliotheken wie Koffein oder Guava-Cache?Mar 17, 2025 pm 05:44 PM

In dem Artikel wird in der Implementierung von mehrstufigem Caching in Java mithilfe von Koffein- und Guava-Cache zur Verbesserung der Anwendungsleistung erläutert. Es deckt die Einrichtungs-, Integrations- und Leistungsvorteile sowie die Bestrafung des Konfigurations- und Räumungsrichtlinienmanagements ab

Wie kann ich JPA (Java Persistence-API) für Objektrelationszuordnungen mit erweiterten Funktionen wie Caching und faulen Laden verwenden?Mar 17, 2025 pm 05:43 PM

In dem Artikel werden mit JPA für Objektrelationszuordnungen mit erweiterten Funktionen wie Caching und faulen Laden erläutert. Es deckt Setup, Entity -Mapping und Best Practices zur Optimierung der Leistung ab und hebt potenzielle Fallstricke hervor. [159 Charaktere]

Wie funktioniert der Klassenladungsmechanismus von Java, einschließlich verschiedener Klassenloader und deren Delegationsmodelle?Mar 17, 2025 pm 05:35 PM

Mit der Klassenbelastung von Java wird das Laden, Verknüpfen und Initialisieren von Klassen mithilfe eines hierarchischen Systems mit Bootstrap-, Erweiterungs- und Anwendungsklassenloadern umfasst. Das übergeordnete Delegationsmodell stellt sicher

See all articles