首页 >后端开发 >Python教程 >如何使用 BeautifulSoup 从纽约网站提取停车票数据？

如何使用 BeautifulSoup 从纽约网站提取停车票数据？

Patricia Arquette原创: 2024-10-27 00:57:30626浏览

How to Extract Parking Ticket Data from a NYC Website with BeautifulSoup?

使用 Python 的 BeautifulSoup 解析 HTML 表格

在处理网页抓取项目时，了解如何有效地解析 HTML 表格至关重要。 BeautifulSoup 是一个流行的 Python 库，它提供了一种从 HTML 文档中提取数据的强大方法。在本文中，我们将探讨一个特定场景：使用 BeautifulSoup 解析 NYC 停车罚单表。

问题：

要学习 Python 的请求和 BeautifulSoup 库，您需要我们的任务是编写一个简单的纽约停车罚单解析器。导航到指定 URL 并获得 HTML 响应后，您需要帮助提取“lineItemsTable”HTML 表格中列出的所有停车票。

如何解析表格：

解析表的关键在于利用BeautifulSoup的表解析功能。以下是完成此操作的修订版 Python 代码片段：

<code class="python">import requests
from bs4 import BeautifulSoup

plate = "T630134C"
plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}")
soup = BeautifulSoup(plateRequest.text, "html.parser")

table = soup.find("table", {"class": "lineItemsTable"})
table_body = table.find("tbody")

rows = table_body.find_all("tr")
data = []
for row in rows:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    data.append([col for col in cols if col])</code>

附加说明：

提取的数据中的最后一行包括“付款金额”标签，它不是表格的一部分。您可以通过检查行长度是否小于 7 来过滤掉此内容。
每行的最后一列是需要特殊处理的输入文本框。

通过以下操作步骤，您可以使用 BeautifulSoup 有效解析 NYC 停车罚单表，并提取项目所需的所有信息。

以上是如何使用 BeautifulSoup 从纽约网站提取停车票数据？的详细内容。更多信息请关注PHP中文网其他相关文章！

Python less html beautifulsoup if for Filter using Length this column input table

声明：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：How Do Python and Ruby Differ in Their Implementations of \"Everything\'s an Object\"?下一篇：How to Effectively Combine Multiple Conditions in NumPy\'s where Function?

查看更多