ホームページ  >  記事  >  バックエンド開発  >  BeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?

BeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-28 10:00:29971ブラウズ

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup 解析テーブル

Python では、BeautifulSoup は HTML ドキュメントを解析するための強力なメソッドを提供します。テーブルから特定のデータを取得する必要があるこのようなシナリオに直面した場合、BeautifulSoup が役に立ちます。

ターゲットの広告申込情報テーブルを抽出するには、soup.find() を利用し、テーブル内で適切な属性を指定します。括弧。この場合、次のものが必要になります。

<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>

次に、table.findAll("tr") を使用してテーブル内の各行を反復できます。各行内では、row.findAll("td") を使用してテーブルのセル (td) にアクセスできます。

拡張コード スニペットは次のとおりです:

<code class="python">data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values</code>

このコードはリストを生成します。リストの各サブリストがテーブル内の行を表します。 Web サイトから必要なデータを効率的に取得します。

以上がBeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。