Heim  >  Artikel  >  Backend-Entwicklung  >  Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

高洛峰
高洛峰Original
2017-02-20 10:06:372501Durchsuche

Verwendete Tools: Python2.7

Scrapy-Framework

sublime text3

Eins. Erstellen Sie Python (Windows-Version)

1. Installieren Sie Python2.7 --- Geben Sie dann Python in cmd ein. Wenn die Schnittstelle wie folgt lautet, ist die Installation erfolgreich

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

2. Integrieren Sie das Scrapy-Framework ---- Geben Sie die Befehlszeile ein: pip install Scrapy

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Die erfolgreiche Installationsoberfläche lautet wie folgt:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Fehlgeschlagen Es gibt viele Situationen, zum Beispiel:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Lösung:

Andere Fehler können auf Baidu gesucht werden.

Zwei. Beginnen Sie mit der Programmierung.

Der Python-Code lautet wie folgt:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Codekommentare: Zwei Module urllib, re werden eingeführt. Definieren Sie zwei Funktionen. Die erste Funktion besteht darin, die gesamten Zielwebseitendaten abzurufen. Die zweite Funktion besteht darin, das Zielbild auf der Zielwebseite abzurufen, die Webseite zu durchlaufen und die erfassten Bilder beginnend bei 0 zu sortieren.

Hinweis: Wissenspunkte zum Modul:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Crawling-Bild-Renderings:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Bild Standardmäßig , der Speicherpfad befindet sich im selben Verzeichnis wie die erstellte .py-Datei.

2. Crawlen Sie Baidu-Bilder mit Anti-Crawler-Maßnahmen. Wie Baidu-Bilder usw.

Zum Beispiel die Stichwortsuche „Emoticon-Paket“ https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7% E9% B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

Die Bilder werden scrollend geladen , und die größten werden als erste 30 Fotos mit Priorität gecrawlt.

Der Code lautet wie folgt:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Codekommentare: Importieren Sie 4 Module, und das Betriebssystemmodul wird verwendet, um den Speicherpfad anzugeben. Die ersten beiden Funktionen sind die gleichen wie oben. Die dritte Funktion verwendet eine if-Anweisung und eine tryException.

Der Crawling-Prozess ist wie folgt:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Crawling-Ergebnisse:

Python-Crawler: Crawlen Sie Baidu-Bilder anhand von Schlüsselwörtern

Hinweis: Schreiben Sie Python Code Achten Sie auf die Ausrichtung und mischen Sie keine Tabulatoren und Leerzeichen, da sonst leicht Fehler gemeldet werden können.

Weitere Python-Crawler: Crawlen von Baidu-Bildern anhand von Schlüsselwörtern finden Sie auf der chinesischen PHP-Website für verwandte Artikel!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn