Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah saya boleh mengekstrak waktu Sunrise dan Sunset daripada tapak web menggunakan pengikisan web Python?
Mengikis Kandungan Web dengan Python
Mengikis web, proses mengekstrak data daripada sumber dalam talian, ialah teknik yang berharga untuk mengumpul maklumat tanpa manual campur tangan. Dalam soalan ini, kami akan meneroka cara mengikis kandungan web menggunakan Python.
Modul Python untuk Mengikis Web
Python menawarkan beberapa modul untuk memudahkan pengikisan web. Dua yang menonjol ialah:
Tutorial untuk Mengikis Kandungan Web
Untuk menggambarkan pengikisan web dengan Python, pertimbangkan contoh mengekstrak waktu matahari terbit/ terbenam daripada tapak web:
<code class="python">import urllib2 from BeautifulSoup import BeautifulSoup # Open the web page containing the sunrise/sunset times web_page = urllib2.urlopen('http://example.com') # Parse the page using BeautifulSoup soup = BeautifulSoup(web_page.read()) # Find the table containing the times table = soup.find('table', {'class': 'spad'}) # Loop through the table rows for row in table.find('tbody').find_all('tr'): # Extract the date and times tds = row.find_all('td') date = tds[0].string sunrise = tds[1].string # Print the results print(date, sunrise)</code>
Skrip ini menunjukkan cara menghuraikan jadual yang mengandungi masa matahari terbit/ terbenam, mengekstrak data yang berkaitan menggunakan modul Python dan pemilih HTML yang sesuai.
Atas ialah kandungan terperinci Bagaimanakah saya boleh mengekstrak waktu Sunrise dan Sunset daripada tapak web menggunakan pengikisan web Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!