Maison >développement back-end >Tutoriel Python >Vous apprendre à explorer des images Web via des mots-clés
Cet article présente principalement le robot d'exploration Python : la méthode d'exploration des images Baidu via des mots-clés. Il a une très bonne valeur de référence, jetons un oeil avec l'éditeur ci-dessous
Outils utilisés : Python2.7, cliquez ici pour télécharger
scrapyFramework
texte sublime3
Un. Construire python (version Windows)
1.Installer python2.7 --- Entrez ensuite python dans cmd, l'interface est la suivante et l'installation est réussi
2. Intégrer le framework Scrapy ----Entrez la ligne de commande : pip install Scrapy
L'interface d'installation réussie est la suivante :
Il existe de nombreuses situations d'échec, voici un exemple :
Solution :
Le reste des erreurs peut être recherché sur Baidu .
Deux. Commencez laProgrammation.
1. Explorer les sites Web statiques sans mesures anti-crawler. Par exemple, Baidu Tieba et Douban Reading.
Par exemple - une publication dans "Desktop Bar" tieba.baidu.com/p/2460150866?red_tag=3569129009
Le code python est le suivant :
CodeCommentaires : Deux modules urllib, re sont introduits. Définissez deux fonctions La première fonction consiste à obtenir l'intégralité des données de la page Web cible, et la deuxième fonction consiste à obtenir l'image cible dans la page Web cible, à parcourir la page Web et à trier les images acquises en commençant. de 0.
Remarque : points de connaissance du module :
Exploration des rendus d'images :
image La sauvegarde le chemin est par défaut le même répertoire que le fichier .py créé.
2. Explorez les images Baidu avec des mesures anti-crawler. Comme les photos Baidu, etc.
Par exemple, la recherche par mot-clé "package d'émoticônes" https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=% B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111
La photo défile Pour charger, explorez d'abord les 30 premières images.
Le code est le suivant :
Commentaires de code : Importez 4 modules, et le module os permet de spécifier la sauvegarde chemin. Les deux premières fonctions sont les mêmes que ci-dessus. La troisième fonction utilise l'instruction if et l'exception tryException.
Le processus d'exploration est le suivant :
Résultats de l'exploration :
Remarque : écrivez python code Faites attention à l'alignement et ne mélangez pas les tabulations et les espaces, car il est facile de signaler des erreurs.
[Recommandations associées]
1. Tutoriel vidéo gratuit Python
2. Manuel d'apprentissage Python
3.Tutoriel vidéo orienté objet Python
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!