suchen

Heim  >  Fragen und Antworten  >  Hauptteil

python – Verwenden Sie das Scrapy-Framework, um Baidu-Bilder zu crawlen und blockiert zu werden

Die URL der Anforderungsadresse ist die über Firefox erhaltene JSON-Adresse. Sie kann mit einem Browser geöffnet werden, wurde jedoch beim Crawlen mit Scrapy gesperrt.

https://image.baidu.com/searc...

给我你的怀抱给我你的怀抱2749 Tage vor663

Antworte allen(3)Ich werde antworten

  • 黄舟

    黄舟2017-05-24 11:36:48

    settings.pyROBOTSTXT_OBEY = False 试试。

    Antwort
    0
  • 某草草

    某草草2017-05-24 11:36:48

    不要加hearders试试

    Antwort
    0
  • 为情所困

    为情所困2017-05-24 11:36:48

    赞成楼上,如果还会被墙。可采用scrapy+selenium+phantomjs的方式。

    Antwort
    0
  • StornierenAntwort