ホームページ  >  に質問  >  本文

Python - スクレイピー フレームワークを使用して Baidu の画像をクロールするとブロックされる

リクエストアドレスのurlはfirefoxで取得したjsonのアドレスですブラウザでは開けますがscrapyでクローリングするとBANされましたので解決してください。

https://image.baidu.com/search...

给我你的怀抱给我你的怀抱2705日前635

全員に返信(3)返信します

  • 黄舟

    黄舟2017-05-24 11:36:48

    settings.pyROBOTSTXT_OBEY = Falseでお試しください。

    返事
    0
  • 某草草

    某草草2017-05-24 11:36:48

    聴覚者を追加せずに試してください

    返事
    0
  • 为情所困

    为情所困2017-05-24 11:36:48

    まだ壁があるなら、私は二階に同意します。 Scrapy+Selenium+phantomjsという方法が使えます。

    返事
    0
  • キャンセル返事