Maison >développement back-end >Tutoriel Python >Comment BeautifulSoup peut-il être utilisé pour extraire des données d'un tableau HTML en Python ?
En Python, BeautifulSoup fournit des méthodes puissantes pour analyser les documents HTML. Face à un scénario comme celui-ci dans lequel vous devez récupérer des données spécifiques d'une table, BeautifulSoup s'avère pratique.
Pour extraire la table des éléments de campagne ciblés, utilisez soup.find(), en spécifiant les attributs appropriés dans le parenthèses. Dans ce cas, vous aurez besoin de :
<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>
Ensuite, vous pouvez parcourir chaque ligne du tableau en utilisant table.findAll("tr"). Dans chaque ligne, vous pouvez accéder aux cellules du tableau (td) en utilisant row.findAll("td").
Voici un extrait de code amélioré :
<code class="python">data = [] table_body = table.find('tbody') rows = table_body.find_all('tr') for row in rows: cols = row.find_all('td') cols = [ele.text.strip() for ele in cols] data.append([ele for ele in cols if ele]) # Remove empty values</code>
Ce code produira une liste de listes, chaque sous-liste représentant une ligne du tableau. Il capturera efficacement les données nécessaires du site Web.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!