Heim > Artikel > Backend-Entwicklung > Empfohlene Materialien für praktische Python-Crawler-Video-Tutorials
Dieses Set „Python Practical Crawler Video Tutorial“ ist ein sehr leistungsstarkes Python-Practice-Video-Tutorial. Freunde, die bereits über ein gewisses Verständnis von Python verfügen und Python beherrschen und einen Schritt weiter gehen möchten, können dieses Tutorial-Set lernen!
Adresse für die Kurswiedergabe: http://www.php.cn/course/603.html
Der Unterrichtsstil des Lehrers:
Die Vorträge des Lehrers sind einfach und ausführlich, klar in der Struktur, werden Schicht für Schicht analysiert, ineinandergreifend, streng in der Argumentation, streng in der Struktur und im Gebrauch Die logische Kraft des Denkens, um die Aufmerksamkeit der Schüler zu erregen. Nutzen Sie die Vernunft, um den Unterrichtsprozess im Klassenzimmer zu steuern. Durch das Anhören der Vorlesungen des Lehrers lernen die Schüler nicht nur Wissen, sondern erhalten auch eine Denkschulung und werden auch von der strengen akademischen Haltung des Lehrers beeinflusst und beeinflusst
Der schwierigere Punkt in diesem Video ist die Python Crawler:
Wenn wir jeden Tag im Internet surfen, sehen wir oft einige gut aussehende Bilder, und wir möchten diese Bilder speichern und herunterladen. Oder Benutzer können „Desktop-Hintergrund erstellen“ verwenden oder es als Designmaterial verwenden.
Unsere häufigste Vorgehensweise besteht darin, mit der rechten Maustaste zu klicken und „Speichern unter“ auszuwählen. Für einige Bilder gibt es jedoch keine Option zum Speichern unter, wenn Sie mit der rechten Maustaste klicken. Eine andere Möglichkeit besteht darin, sie mit einem Screenshot-Tool aufzunehmen, was jedoch die Klarheit des Bildes verringert. Okay~! Tatsächlich sind Sie sehr gut. Klicken Sie mit der rechten Maustaste, um den Quellcode der Seite anzuzeigen.
Wir können Python verwenden, um eine so einfache Crawler-Funktion zu implementieren und den gewünschten Code lokal zu crawlen. Schauen wir uns an, wie man mit Python eine solche Funktion implementiert.
1. Holen Sie sich die gesamten Seitendaten
Zuerst können wir die gesamten Seiteninformationen des herunterzuladenden Bildes abrufen.
getjpg.py
#coding=utf-8 import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html html = getHtml("http://tieba.baidu.com/p/2738151262") print html
Das Urllib-Modul bietet eine Schnittstelle zum Lesen von Webseitendaten, wir können sie wie eine lokale Datei lesen Lesen Sie Daten auf www und ftp. Zuerst definieren wir eine getHtml()-Funktion:
Die urllib.urlopen()-Methode wird zum Öffnen einer URL-Adresse verwendet.
Die Methode read() wird verwendet, um die Daten auf der URL zu lesen, eine URL an die Funktion getHtml() zu übergeben und die gesamte Seite herunterzuladen. Beim Ausführen des Programms wird die gesamte Webseite ausgedruckt.
Das obige ist der detaillierte Inhalt vonEmpfohlene Materialien für praktische Python-Crawler-Video-Tutorials. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!