Maison >développement back-end >Tutoriel Python >Comment puis-je analyser le HTML et accéder aux éléments à l'aide de Python ?
Analyse HTML avec Python
Question :
Comment puis-je accéder et manipuler des éléments HTML utiliser un analyseur Python ? J'ai besoin d'un module qui me permette d'obtenir les balises et leur contenu dans un format structuré, similaire à la structure imbriquée affichée dans la fonctionnalité "Inspecter l'élément" de Firefox.
Réponse :
BeautifulSoup
Le module BeautifulSoup est une bibliothèque Python populaire et puissante pour l'analyse HTML. Il peut convertir le HTML en une structure de données imbriquée, vous permettant d'accéder et de parcourir facilement les éléments HTML.
Exemple :
Pour analyser le document HTML que vous avez fourni :
from bs4 import BeautifulSoup html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
Pour récupérer le contenu du div "conteneur" au sein du "corps" tag :
print(parsed_html.body.find('div', attrs={'class':'container'}).text)
Autres options :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!