Maison >développement back-end >C++ >Comment supprimer efficacement les balises HTML des chaînes dans ASP.NET ?
Supprimer les balises HTML des chaînes dans ASP.NET
Dans ASP.NET, la suppression des balises HTML des chaînes peut être réalisée via les méthodes suivantes :
Bien que la méthode de remplacement d'expression régulière présente certaines limites, elle peut toujours supprimer de manière fiable les balises HTML des chaînes :
Recherchez et remplacez "1*(>|$)".
Normalisez la chaîne en remplaçant "[srn]" par un seul espace.
Supprimez les espaces de début et de fin de la chaîne de résultat.
Exemple :
Entrée = "
" nettoyé = Regex.Replace(input, "1*(>|$)").Normalize().Trim() Console.WriteLine(nettoyé); // Sortie : "Bonjour"
Remarque : Cette méthode présente des limites lorsqu'elle rencontre du HTML/XML contenant ">" dans la valeur de l'attribut.
Envisagez d'utiliser une bibliothèque d'analyse HTML mature, telle que :
Ces bibliothèques offrent des capacités d'analyse et de nettoyage HTML complètes et personnalisables.
Exemple (en utilisant HTMLAgilityPack) :
en utilisant HtmlAgilityPack ; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(entrée); Console.WriteLine(doc.DocumentNode.InnerText); // Sortie : "Bonjour"
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!