Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimanakah perpustakaan Python seperti urllib2 dan BeautifulSoup boleh digunakan untuk mengikis waktu matahari terbit dan terbenam secara pemrograman daripada tapak web?

Bagaimanakah perpustakaan Python seperti urllib2 dan BeautifulSoup boleh digunakan untuk mengikis waktu matahari terbit dan terbenam secara pemrograman daripada tapak web?

Patricia Arquette
Patricia Arquetteasal
2024-10-26 23:07:30621semak imbas

How can Python libraries like urllib2 and BeautifulSoup be used to programmatically scrape sunrise and sunset times from a website?

Pengikisan Web Terprogram dengan Python

Pengenalan: Pengikisan web, proses mengekstrak data daripada tapak web, ialah teknik yang berharga untuk analisis data dan automasi. Python menawarkan pelbagai modul yang memperkasakan pembangun untuk mengikis kandungan web dengan berkesan.

Mengikis Web dengan urllib2 dan BeautifulSoup

Untuk matlamat khusus anda untuk mendapatkan semula waktu matahari terbit/matahari terbenam daripada laman web, gabungan urllib2 dan perpustakaan BeautifulSoup adalah penyelesaian yang sesuai. Modul ini berfungsi seiring untuk mengambil dan menghuraikan kandungan web, membolehkan anda mengakses maklumat yang berkaitan.

Panduan Kod

Kod Python yang diberikan memberikan contoh yang berkesan tentang cara untuk menggunakan pendekatan ini:

<code class="python">import urllib2
from BeautifulSoup import BeautifulSoup

# Fetch the web page
response = urllib2.urlopen('http://example.com')

# Parse the HTML content
soup = BeautifulSoup(response.read())

# Identify the desired table and rows
table = soup('table', {'class': 'spad'})[0]
rows = table.tbody('tr')

# Extract and print the date, sunrise, and sunset information
for row in rows:
    tds = row('td')
    print(tds[0].string, tds[1].string)</code>

Dalam kod ini:

  • urllib2.urlopen('http://example.com').read() mengambil kandungan HTML tapak web yang ditentukan.
  • BeautifulSoup(response.read()) menghuraikan kandungan HTML ke dalam objek berstruktur.
  • jadual = soup('table', {'class': 'spad'})[0] mencari jadual minat berdasarkan atribut kelasnya.
  • rows = table.tbody('tr ') memilih baris jadual di mana waktu matahari terbit/ terbenam.
  • print(tds[0].string, tds[1].string) mengekstrak dan mencetak tarikh dan waktu matahari terbit/ terbenam.

Sumber Tambahan

Untuk panduan lanjut, anda boleh rujuk tutorial berikut:

  • [Mengikis Web dengan Python Menggunakan Sup Cantik dan Permintaan](https://www.edureka.co/blog/web-scraping-with-python/)
  • [Mengikis web menggunakan Python](https:/ /www.geeksforgeeks.org/web-scraping-using-python/)

Atas ialah kandungan terperinci Bagaimanakah perpustakaan Python seperti urllib2 dan BeautifulSoup boleh digunakan untuk mengikis waktu matahari terbit dan terbenam secara pemrograman daripada tapak web?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn