Maison > Article > interface Web > Comment extraire du texte brut du HTML avec JavaScript ?
Suppression d'éléments HTML pour l'extraction de texte brut avec JavaScript
Lorsque vous traitez du contenu HTML, il existe des situations dans lesquelles vous devrez peut-être extraire le contenu pur texte sans les balises d’élément HTML. JavaScript fournit un moyen pratique d'y parvenir.
Énoncé du problème :
Vous disposez d'un document HTML avec un bouton et du texte entouré d'un
élément. En cliquant sur le bouton, vous souhaitez supprimer toutes les balises d'éléments HTML du texte contenu dans ce
élément, ne laissant que le texte brut.
Solution :
Pour y parvenir, suivez ces étapes en utilisant JavaScript :
<code class="javascript">function get_content() { // Get the element by its ID var element = document.getElementById('txt'); // Extract the plain text using either innerText or textContent // Depending on the browser support and specific requirements, you can use either of these methods. var text = element.innerText || element.textContent; // Replace HTML elements with the pure text element.innerHTML = text; }</code>
En utilisant cet élément fonction, lorsque l'utilisateur clique sur le bouton, les balises HTML dans le
L'élément sera supprimé, ne laissant que le texte brut.
innerText vs textContent :
Le choix entre innerText et textContent dépend de vos besoins. innerText imite le texte visible, y compris les espaces, les sauts de ligne et le texte masqué. D'un autre côté, textContent supprime tout formatage ou élément masqué.
Compatibilité :
innerText a une meilleure compatibilité avec les anciens navigateurs IE mais peut ne pas convenir au HTML complexe. structures. textContent est recommandé pour un comportement plus robuste et cohérent entre les navigateurs.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!