Maison >développement back-end >C++ >Comment supprimer les balises HTML d'un document utilisant des expressions régulières C #?
Lors du traitement du contenu HTML, la suppression des étiquettes est essentielle pour l'extraction des données ou l'analyse de texte. Une méthode consiste à utiliser l'expression régulière C # pour effectuer cette tâche.
Question:
Comment utiliser l'expression régulière C # pour supprimer toutes les balises HTML (y compris les parenthèses) du document HTML?Code:
Explication:
string htmlDocument = @"<p><b>Example text</b> containing tags</p>"; string result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty); Console.WriteLine(result); // 输出:Example text containing tags
Mode d'expression régulière Faites correspondre toute étiquette (à l'exclusion des symboles de changement) à la fin de .
]*>
Cette méthode supprime efficacement toutes les balises des documents HTML, y compris les supports Sprite.
<code>>
Regex.Replace
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!