Rumah >pembangunan bahagian belakang >Tutorial Python >Cara Mengekstrak Data daripada Jadual HTML menggunakan Python BeautifulSoup: Panduan Komprehensif untuk Menghuraikan Tiket Tempat Letak Kereta?

Cara Mengekstrak Data daripada Jadual HTML menggunakan Python BeautifulSoup: Panduan Komprehensif untuk Menghuraikan Tiket Tempat Letak Kereta?

Susan Sarandon
Susan Sarandonasal
2024-10-30 12:54:03861semak imbas

How to Extract Data from HTML Tables using Python BeautifulSoup: A Comprehensive Guide to Parsing Parking Tickets?

Jadual Parsing Python BeautifulSoup: Panduan Komprehensif

Apabila mengekstrak data daripada jadual HTML menggunakan BeautifulSoup Python, memahami cara menghuraikan susun atur jadual tertentu ialah penting. Dalam senario ini, cabarannya terletak pada menghuraikan "lineItemsTable" daripada tapak web tiket letak kereta.

Untuk mengekstrak tiket, ikut langkah berikut:

<code class="python"># Retrieve the table element
table = soup.find("table", {"class": "lineItemsTable"})

# Initialize an empty list to store the tickets
data = []

# Iterate over each row in the table
for row in table.findAll("tr"):

    # Extract each cell in the row
    cells = row.findAll("td")

    # Clean the cell data and store it in a list
    cells = [cell.text.strip() for cell in cells]

    # If the row contains valid data, append it to the list
    if cells:
        data.append([cell for cell in cells if cell])</code>

Pendekatan ini menghasilkan senarai senarai, di mana setiap senarai dalaman mewakili data daripada satu baris tiket, tidak termasuk nilai kosong. Berikut ialah contoh output:

[[u'1359711259', u'SRF', u'08/05/2013', u'5310 4 AVE', u'K', u'19', u'125.00', u'$'],
[u'7086775850', u'PAS', u'12/14/2013', u'3908 6th Ave', u'K', u'40', u'125.00', u'$'],
[u'7355010165', u'OMT', u'12/14/2013', u'3908 6th Ave', u'K', u'40', u'145.00', u'$'],
[...]]

Nota Tambahan:

  • Barisan terakhir mungkin termasuk metadata tentang jumlah pembayaran. Jika bilangan lajur dalam satu baris kurang daripada 7, lajur tersebut hendaklah dibuang.
  • Lajur akhir dalam setiap baris mengandungi kotak teks input yang perlu dikendalikan secara berasingan.

Atas ialah kandungan terperinci Cara Mengekstrak Data daripada Jadual HTML menggunakan Python BeautifulSoup: Panduan Komprehensif untuk Menghuraikan Tiket Tempat Letak Kereta?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn