Maison  >  Article  >  développement back-end  >  Scrapy est à nouveau mis à jour : version officielle 1.0

Scrapy est à nouveau mis à jour : version officielle 1.0

WBOY
WBOYoriginal
2023-06-22 08:54:581194parcourir

Récemment, Scrapy, le framework d'exploration de sites Web de Python, a publié la version officielle 1.0, qui apporte de nombreuses mises à niveau et améliorations importantes à Scrapy. Cet article présentera quelques mises à jour et améliorations importantes apportées par la nouvelle version de Scrapy.

  1. Moteur de réseau asynchrone basé sur Twisted

Dans la version 1.0, Scrapy a remplacé le moteur de concurrence précédent par un moteur de réseau asynchrone basé sur Twisted. Twisted est un excellent framework basé sur les événements qui prend en charge la programmation asynchrone des E/S et du réseau, et Scrapy lui-même s'appuie également sur Twisted. L'utilisation d'un moteur de réseau asynchrone basé sur Twisted peut rendre Scrapy plus efficace et plus stable.

  1. Nouveau sélecteur

Dans la version 1.0, Scrapy introduit un nouveau sélecteur, implémenté sur la base de la bibliothèque lxml. Par rapport à l'ancien Selector, le nouveau Selector est plus rapide et plus stable, et prend également en charge davantage de langages de sélection tels que les sélecteurs XPath et CSS. De plus, le nouveau sélecteur prend également en charge les nœuds imbriqués, c'est-à-dire l'utilisation du caractère « / » dans l'expression du sélecteur pour sélectionner les nœuds parents et les nœuds enfants.

  1. Nouveau pipeline d'articles

Dans la version 1.0, Scrapy introduit un nouveau pipeline d'articles plus flexible et plus facile à utiliser. Le nouveau Item Pipeline prend en charge plusieurs processeurs et peut envoyer des données à différents processeurs pour les traiter selon les besoins, tels que des bases de données, des fichiers, etc. De plus, le nouveau Item Pipeline peut également filtrer et trier les données pour répondre à divers besoins.

  1. Nouveaux outils de ligne de commande

Dans la version 1.0, Scrapy introduit de nouveaux outils de ligne de commande, rendant Scrapy plus facile à utiliser. Le nouvel outil de ligne de commande fournit de nombreuses nouvelles commandes pour le débogage, les tests et l'optimisation du code d'exploration. Par exemple, vous pouvez utiliser la commande « check » pour vérifier les erreurs de syntaxe du code du robot, utiliser la commande « spider » pour démarrer le robot et afficher les résultats, etc.

  1. Autres améliorations

En plus des mises à jour importantes mentionnées ci-dessus, la version 1.0 de Scrapy présente d'autres améliorations. Par exemple, le mécanisme de gestion des exceptions a été optimisé pour rendre Scrapy plus robuste et fiable. De plus, la version 1.0 fournit également un nouveau format de stockage de données, prenant en charge l'enregistrement direct des données au format JSON, XML et autres formats sans avoir besoin de conversion et de traitement supplémentaires.

Résumé :

La version 1.0 de Scrapy apporte de nombreuses améliorations et mises à jour importantes, le rendant plus efficace, flexible et facile à utiliser. Des fonctionnalités telles que la nouvelle version du moteur de réseau asynchrone basé sur Twisted, le nouveau sélecteur, le nouveau pipeline d'éléments et les nouveaux outils de ligne de commande font passer Scrapy au niveau supérieur. Pour les développeurs de robots d'exploration, la version 1.0 de Scrapy est sans aucun doute une version qui mérite d'être attendue et utilisée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn