PHP中文网2017-04-17 17:52:11
Si vous n'en avez vraiment aucune idée, voici quelques informations pour votre référence, mais l'essentiel est que vous devriez les lire...
Tout d'abord, qu'est-ce qu'un web crawler :
Vous pouvez simplement jeter un œil au robot d'exploration wiki-web
Revenez sur ce site : l'école universitaire de mathématiques propose des enseignements simples (et des vidéos), qui, à mon avis, conviennent très bien aux débutants. Vous pouvez partir de cet article : Qu'est-ce qu'un robot d'exploration de sites Web
<🎜. >
Vient ensuite le
Tutoriel d'introduction :
- En fait, il existe une méthode très simple : il suffit de choisir un outil d'exploration pour lire le document. Si vous n'avez aucune indication, vous pouvez choisir de lire le document Beautiful Soup Chinese. trop compliqué, il vous faudra du temps pour tout lire.
- À l'heure actuelle, l'École universitaire de mathématiques propose une série d'enseignements introductifs et d'enseignements pratiques. Je pense qu'ils devraient mériter une référence. Les premiers articles du cours d'introduction sont répertoriés ci-dessous :
- Commencez à utiliser Python pour écrire un robot d'exploration Web (Crawler)
- Comment installer Jupyter (Ipython Notebook)
- Introduction au fonctionnement de Jupyter (1)
- Comment utiliser GET pour explorer du contenu Web
- Comment utiliser POST pour explorer du contenu Web ?
- Comment utiliser la suite Python : BeautifulSoup4 pour analyser du contenu web
- Comment utiliser les requêtes Python et BeautifulSoup4 pour compléter le robot Taobao
L'étape suivante consiste à comprendre ces
outils et framework crawler :
- Cet endroit est très complet : liste d'outils de robots d'exploration Python avec lien de téléchargement du code Github
- Ce blog contient également de nombreux contenus pédagogiques
Pour les discussions sur les outils et frameworks de robots d'exploration, veuillez vous référer à cet article Zhihu : lors de l'écriture de robots d'exploration en Python, quelle méthode et quel framework sont les meilleurs ?
Je pense qu'il y a beaucoup de ressources sur Internet, on peut toutes les essayer, tout est difficile au début, allez !
répondre
0