Heim  >  Artikel  >  Backend-Entwicklung  >  Wie kann BeautifulSoup verwendet werden, um Daten aus einer HTML-Tabelle in Python zu extrahieren?

Wie kann BeautifulSoup verwendet werden, um Daten aus einer HTML-Tabelle in Python zu extrahieren?

Patricia Arquette
Patricia ArquetteOriginal
2024-10-28 10:00:29971Durchsuche

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup Parsing Table

In Python bietet BeautifulSoup leistungsstarke Methoden zum Parsen von HTML-Dokumenten. Wenn Sie mit einem Szenario wie diesem konfrontiert werden, in dem Sie bestimmte Daten aus einer Tabelle abrufen müssen, ist BeautifulSoup praktisch.

Um die gezielte Einzelpostentabelle zu extrahieren, verwenden Sie „soup.find()“ und geben Sie die entsprechenden Attribute innerhalb der Tabelle an Klammern. In diesem Fall benötigen Sie:

<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>

Als nächstes können Sie mit table.findAll("tr") über jede Zeile in der Tabelle iterieren. Innerhalb jeder Zeile können Sie mit row.findAll("td") auf die Tabellenzellen (td) zugreifen.

Hier ist ein erweiterter Codeausschnitt:

<code class="python">data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values</code>

Dieser Code erstellt eine Liste von Listen, wobei jede Unterliste eine Zeile in der Tabelle darstellt. Es erfasst effizient die erforderlichen Daten von der Website.

Das obige ist der detaillierte Inhalt vonWie kann BeautifulSoup verwendet werden, um Daten aus einer HTML-Tabelle in Python zu extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn