Maison  >  Article  >  développement back-end  >  Comment BeautifulSoup peut-il être utilisé pour extraire des données d’un tableau HTML en Python ?

Comment BeautifulSoup peut-il être utilisé pour extraire des données d’un tableau HTML en Python ?

Patricia Arquette
Patricia Arquetteoriginal
2024-10-28 10:00:29971parcourir

How can BeautifulSoup be used to extract data from a HTML table in Python?

Tableau d'analyse BeautifulSoup

En Python, BeautifulSoup fournit des méthodes puissantes pour analyser les documents HTML. Face à un scénario comme celui-ci dans lequel vous devez récupérer des données spécifiques d'une table, BeautifulSoup s'avère pratique.

Pour extraire la table des éléments de campagne ciblés, utilisez soup.find(), en spécifiant les attributs appropriés dans le parenthèses. Dans ce cas, vous aurez besoin de :

<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>

Ensuite, vous pouvez parcourir chaque ligne du tableau en utilisant table.findAll("tr"). Dans chaque ligne, vous pouvez accéder aux cellules du tableau (td) en utilisant row.findAll("td").

Voici un extrait de code amélioré :

<code class="python">data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values</code>

Ce code produira une liste de listes, chaque sous-liste représentant une ligne du tableau. Il capturera efficacement les données nécessaires du site Web.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn