Maison >développement back-end >Tutoriel Python >Vous apprendre à explorer des images Web via des mots-clés

Vous apprendre à explorer des images Web via des mots-clés

Y2J
Y2Joriginal
2017-05-09 14:21:015183parcourir

Cet article présente principalement le robot d'exploration Python : la méthode d'exploration des images Baidu via des mots-clés. Il a une très bonne valeur de référence, jetons un oeil avec l'éditeur ci-dessous

Outils utilisés : Python2.7, cliquez ici pour télécharger

scrapyFramework

texte sublime3

Un. Construire python (version Windows)

1.Installer python2.7 --- Entrez ensuite python dans cmd, l'interface est la suivante et l'installation est réussi

2. Intégrer le framework Scrapy ----Entrez la ligne de commande : pip install Scrapy

L'interface d'installation réussie est la suivante :

Il existe de nombreuses situations d'échec, voici un exemple :

Solution :

Le reste des erreurs peut être recherché sur Baidu .

Deux. Commencez laProgrammation.

1. Explorer les sites Web statiques sans mesures anti-crawler. Par exemple, Baidu Tieba et Douban Reading.

Par exemple - une publication dans "Desktop Bar" tieba.baidu.com/p/2460150866?red_tag=3569129009

Le code python est le suivant :

CodeCommentaires : Deux modules urllib, re sont introduits. Définissez deux fonctions La première fonction consiste à obtenir l'intégralité des données de la page Web cible, et la deuxième fonction consiste à obtenir l'image cible dans la page Web cible, à parcourir la page Web et à trier les images acquises en commençant. de 0.

Remarque : points de connaissance du module :

Exploration des rendus d'images :

image La sauvegarde le chemin est par défaut le même répertoire que le fichier .py créé.

2. Explorez les images Baidu avec des mesures anti-crawler. Comme les photos Baidu, etc.

Par exemple, la recherche par mot-clé "package d'émoticônes" https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=% B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

La photo défile Pour charger, explorez d'abord les 30 premières images.

Le code est le suivant :

Commentaires de code : Importez 4 modules, et le module os permet de spécifier la sauvegarde chemin. Les deux premières fonctions sont les mêmes que ci-dessus. La troisième fonction utilise l'instruction if et l'exception tryException.

Le processus d'exploration est le suivant :

Résultats de l'exploration :

Remarque : écrivez python code Faites attention à l'alignement et ne mélangez pas les tabulations et les espaces, car il est facile de signaler des erreurs.

[Recommandations associées]

1. Tutoriel vidéo gratuit Python

2. Manuel d'apprentissage Python

3.

Tutoriel vidéo orienté objet Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn