Maison >développement back-end >C++ >Comment supprimer les balises HTML d'un document utilisant des expressions régulières C #?

Comment supprimer les balises HTML d'un document utilisant des expressions régulières C #?

DDD
DDDoriginal
2025-01-25 11:17:09540parcourir
<p> <img src="/static/imghwm/default1.png" data-src="https://img.php.cn/upload/article/000/000/000/173777503111682.jpg" class="lazy" alt="How to Remove HTML Tags from a Document Using C# Regular Expressions? "> </p> <c> Utilisez C # Expression régulière pour supprimer la balise HTML <p> <strong> </strong> Lors du traitement du contenu HTML, la suppression des étiquettes est essentielle pour l'extraction des données ou l'analyse de texte. Une méthode consiste à utiliser l'expression régulière C # pour effectuer cette tâche. </p> <p> Question: </p> Comment utiliser l'expression régulière C # pour supprimer toutes les balises HTML (y compris les parenthèses) du document HTML? <p> <strong> Code: </strong> </p> <p> <strong> Explication: </strong> </p> <pre class="brush:php;toolbar:false"><code class="language-csharp">string htmlDocument = @"<p><b>Example text</b> containing tags</p>"; string result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty); Console.WriteLine(result); // 输出:Example text containing tags</code></pre> <p> Mode d'expression régulière <strong> Faites correspondre toute étiquette (à l'exclusion des symboles de changement) à la fin de </strong>. </p> <ul> Méthodes Remplacez tous les modes de correspondance en chaîne vide. <li> <code><[^>]*></code> Cette méthode supprime efficacement toutes les balises des documents HTML, y compris les supports Sprite. <code><</code> <code>></code> </li> Remarque: <li> <code>Regex.Replace</code> </li> Bien que les expressions régulières soient généralement utiles, il convient de noter qu'ils ont des limites lors du traitement des documents HTML ou XML. Ils ne peuvent pas gérer efficacement les structures imbriquées, ce qui peut entraîner des résultats inattendus dans certains cas (tels que les supports de sprite contenant des CDATA). Par conséquent, pour la structure HTML complexe, il est recommandé d'utiliser un analyseur HTML plus fort. <li> </ul></c>

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn