Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?

Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?

Patricia Arquette
Patricia Arquetteasal
2024-10-27 00:57:30506semak imbas

How to Extract Parking Ticket Data from a NYC Website with BeautifulSoup?

Menghuraikan Jadual HTML dengan Python's BeautifulSoup

Apabila bekerja dengan projek mengikis web, adalah penting untuk mengetahui cara menghuraikan jadual HTML dengan cekap. BeautifulSoup, perpustakaan Python yang popular, menawarkan cara yang berkesan untuk mengekstrak data daripada dokumen HTML. Dalam artikel ini, kami akan meneroka senario tertentu: menghuraikan jadual tiket letak kereta NYC menggunakan BeautifulSoup.

Masalah:

Untuk mempelajari permintaan Python dan perpustakaan BeautifulSoup, anda ditugaskan untuk menulis penghurai tiket letak kereta NYC yang mudah. Selepas menavigasi ke URL yang ditetapkan dan mendapatkan respons HTML, anda memerlukan bantuan mengekstrak semua tiket letak kereta yang disenaraikan dalam jadual HTML "lineItemsTable".

Cara Menghuraikan Jadual:

Kunci untuk menghurai jadual terletak pada penggunaan keupayaan menghurai jadual BeautifulSoup. Berikut ialah coretan kod Python yang disemak semula yang mencapai ini:

<code class="python">import requests
from bs4 import BeautifulSoup

plate = "T630134C"
plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}")
soup = BeautifulSoup(plateRequest.text, "html.parser")

table = soup.find("table", {"class": "lineItemsTable"})
table_body = table.find("tbody")

rows = table_body.find_all("tr")
data = []
for row in rows:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    data.append([col for col in cols if col])</code>

Nota Tambahan:

  • Baris terakhir dalam data yang diekstrak termasuk "Amaun Pembayaran" label, yang bukan sebahagian daripada jadual. Anda boleh menapis ini keluar dengan menyemak sama ada panjang baris kurang daripada 7.
  • Lajur terakhir dalam setiap baris ialah kotak teks input yang memerlukan pengendalian khas.

Dengan mengikuti ini langkah, anda boleh menghuraikan jadual tiket letak kereta NYC dengan berkesan menggunakan BeautifulSoup dan mengekstrak semua maklumat yang diperlukan untuk projek anda.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn