recherche

Maison  >  Questions et réponses  >  le corps du texte

python - pyspider爬取时fetcher报超时错误:fetcher/: 504 Gateway Time-out

有时爬虫会报如下超时错误:

Traceback (most recent call last):
  File "/opt/pyspider/pyspider/run.py", line 351, in <lambda>
    app.config['fetch'] = lambda x: umsgpack.unpackb(fetcher_rpc.fetch(x).data)
  File "/usr/lib/python2.7/xmlrpclib.py", line 1233, in __call__
    return self.__send(self.__name, args)
  File "/usr/lib/python2.7/xmlrpclib.py", line 1587, in __request
    verbose=self.__verbose
  File "/usr/lib/python2.7/xmlrpclib.py", line 1273, in request
    return self.single_request(host, handler, request_body, verbose)
  File "/usr/lib/python2.7/xmlrpclib.py", line 1321, in single_request
    response.msg,
ProtocolError: <ProtocolError for fetcher/: 504 Gateway Time-out>

请问有什么好的方法避免?

高洛峰高洛峰2813 Il y a quelques jours1183

répondre à tous(2)je répondrai

  • 巴扎黑

    巴扎黑2017-04-18 09:47:14

    Cette erreur n'apparaîtra que lors du débogage

    répondre
    0
  • ringa_lee

    ringa_lee2017-04-18 09:47:14

    @zuzhaochao
    Il s'agit en effet d'un désalignement frontal lors du débogage, et le récupérateur en arrière-plan signalera une telle erreur :
    [E 161014 23:45:09 tornado_fetcher:202] [599] douban : f25b579c7b441d19bc800412cccb145b https://movie.douban.com/revi... ValueError('Aucun objet JSON n'a pu être décodé',) 50.00s
    Après avoir terminé le débogage, lorsque j'ai réellement commencé à explorer, il y aurait un grand nombre de messages après un certain temps. Cette erreur se produit et l'état du robot d'exploration s'affiche comme « PAUSED » sur la page. Quel est le problème ? Comment le résoudre ?

    répondre
    0
  • Annulerrépondre