Heim >Backend-Entwicklung >Python-Tutorial >Wie können Python-Bibliotheken wie urllib2 und BeautifulSoup verwendet werden, um Sonnenauf- und -untergangszeiten programmgesteuert von einer Website zu extrahieren?

Wie können Python-Bibliotheken wie urllib2 und BeautifulSoup verwendet werden, um Sonnenauf- und -untergangszeiten programmgesteuert von einer Website zu extrahieren?

Patricia Arquette
Patricia ArquetteOriginal
2024-10-26 23:07:30792Durchsuche

How can Python libraries like urllib2 and BeautifulSoup be used to programmatically scrape sunrise and sunset times from a website?

Programmatisches Web Scraping mit Python

Einführung: Web Scraping, der Prozess des Extrahierens von Daten aus Websites, ist eine wertvolle Technik für die Datenanalyse und Automatisierung. Python bietet eine Reihe von Modulen, die es Entwicklern ermöglichen, Webinhalte effektiv zu scrappen.

Web Scraping mit urllib2 und BeautifulSoup

Für Ihr spezifisches Ziel, tägliche Sonnenauf-/-untergangszeiten abzurufen Von einer Website aus ist die Kombination von urllib2 und der BeautifulSoup-Bibliothek eine geeignete Lösung. Diese Module arbeiten zusammen, um Webinhalte abzurufen und zu analysieren, sodass Sie auf die relevanten Informationen zugreifen können.

Code-Komplettlösung

Der angegebene Python-Code bietet ein funktionierendes Beispiel dafür um diesen Ansatz zu verwenden:

<code class="python">import urllib2
from BeautifulSoup import BeautifulSoup

# Fetch the web page
response = urllib2.urlopen('http://example.com')

# Parse the HTML content
soup = BeautifulSoup(response.read())

# Identify the desired table and rows
table = soup('table', {'class': 'spad'})[0]
rows = table.tbody('tr')

# Extract and print the date, sunrise, and sunset information
for row in rows:
    tds = row('td')
    print(tds[0].string, tds[1].string)</code>

In diesem Code:

  • urllib2.urlopen('http://example.com').read() ruft den HTML-Inhalt der angegebenen Website ab.
  • BeautifulSoup(response.read()) analysiert den HTML-Inhalt in ein strukturiertes Objekt.
  • table = Soup('table', {'class': 'spad'})[0] findet die Tabelle von Interesse basierend auf ihrem Klassenattribut.
  • rows = table.tbody('tr ') wählt die Tabellenzeilen aus, in denen sich die Sonnenaufgangs-/Sonnenuntergangszeiten befinden.
  • print(tds[0].string, tds[1].string) extrahiert und druckt die Datum und Sonnenaufgangs-/Sonnenuntergangszeiten.

Zusätzliche Ressourcen

Weitere Anleitungen finden Sie in den folgenden Tutorials:

  • [Web Scraping mit Python unter Verwendung von Beautiful Soup and Requests](https://www.edureka.co/blog/web-scraping-with-python/)
  • [Web Scraping mit Python](https:/ /www.geeksforgeeks.org/web-scraping-using-python/)

Das obige ist der detaillierte Inhalt vonWie können Python-Bibliotheken wie urllib2 und BeautifulSoup verwendet werden, um Sonnenauf- und -untergangszeiten programmgesteuert von einer Website zu extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn