Maison >développement back-end >Tutoriel Python >Comment puis-je analyser le HTML et accéder aux éléments à l'aide de Python ?

Comment puis-je analyser le HTML et accéder aux éléments à l'aide de Python ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-13 22:27:15784parcourir

How Can I Parse HTML and Access Elements Using Python?

Analyse HTML avec Python

Question :

Comment puis-je accéder et manipuler des éléments HTML utiliser un analyseur Python ? J'ai besoin d'un module qui me permette d'obtenir les balises et leur contenu dans un format structuré, similaire à la structure imbriquée affichée dans la fonctionnalité "Inspecter l'élément" de Firefox.

Réponse :

BeautifulSoup

Le module BeautifulSoup est une bibliothèque Python populaire et puissante pour l'analyse HTML. Il peut convertir le HTML en une structure de données imbriquée, vous permettant d'accéder et de parcourir facilement les éléments HTML.

Exemple :

Pour analyser le document HTML que vous avez fourni :

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>

Pour récupérer le contenu du div "conteneur" au sein du "corps" tag :

print(parsed_html.body.find('div', attrs={'class':'container'}).text)

Autres options :

  • lxml : Un analyseur XML et HTML rapide et efficace qui prend en charge des fonctionnalités avancées telles que comme XPath.
  • HTMLParser : Un module Python intégré qui fournit un analyseur HTML de base.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn