Maison >développement back-end >Tutoriel Python >Comment décoder des entités HTML dans des chaînes Python ?
Lors de l'analyse HTML avec Beautiful Soup 3, des entités HTML apparaissent souvent et doivent être décodées. Cela peut être fait en utilisant la fonction html.unescape() ou HTMLParser.unescape().
Utilisez html.unescape() :
import html html.unescape('£682m')
De HTMLParser en Python 2.6-2.7 ou html.parser en Python 3, unescape() :
from html.parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Alternativement, avec les six bibliothèques de compatibilité :
from six.moves.html_parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!