Maison  >  Questions et réponses  >  le corps du texte

python - Comment confirmer rapidement le code d'état d'une page Web contenant plus de 200 millions d'URL?

J'ai utilisé des requêtes pour écrire un multi-thread, mais cela semble un peu lent. Existe-t-il d'autres méthodes ?

世界只因有你世界只因有你2712 Il y a quelques jours582

répondre à tous(5)je répondrai

  • PHPz

    PHPz2017-05-18 10:58:14

    Utilisez le support client curl de Tornado pour fermer la connexion après avoir lu l'en-tête de la requête. (Je ne l'ai pas encore essayé. Si le client HTTP qu'il fournit ne prend pas en charge la fermeture de la connexion à mi-chemin, vous pouvez utiliser TCP, puis utiliser http-parser pour l'analyser comme je l'ai fait.)

    D'accord, en fait, vous pouvez simplement ajouter une extension à fetchtitle pour obtenir le code d'état... (n'oubliez pas d'installer pycurl)

    répondre
    0
  • 巴扎黑

    巴扎黑2017-05-18 10:58:14

    Python est intrinsèquement lent. Si vous voulez être rapide, écrivez simplement la requête TCP, puis lisez la réponse. Après avoir lu le statut, fermez le socket.

    répondre
    0
  • ringa_lee

    ringa_lee2017-05-18 10:58:14

    Grâce aux requêtes, les requêtes sont encapsulées simultanément

    https://github.com/kennethrei...

    répondre
    0
  • 迷茫

    迷茫2017-05-18 10:58:14

    Dans ce cas, vous pouvez envisager d'utiliser gevent, tornado, scrapy-redis, asyncio !

    répondre
    0
  • 大家讲道理

    大家讲道理2017-05-18 10:58:14

    Utiliser Head pour demander, cela peut-il être plus rapide ?

    répondre
    0
  • Annulerrépondre