検索

ホームページ  >  に質問  >  本文

Python - Scrapy で CrawlSpider を使用すると、URL が一致しない

私のクローラコードは以下の通りですが、ルールが取得できません。何が問題なのか分かりません。

リーリー

実行エラーリマインダー:

リーリー
为情所困为情所困2755日前862

全員に返信(3)返信します

  • 世界只因有你

    世界只因有你2017-05-18 10:53:02

    主な問題は allow_domains です。このようにコードを作成すると、リンクをキャプチャできます。 リーリー

    主に

    文字列。 allow_domain别带上http://

    さらに、解析モジュールに問題があります。私はそれを変更していません。データを取得したら、自分で変更できるはずです。

    また、前のクラスメートについて文句を言わせてください。彼はコードをまったくデバッグしていませんでしたが、それでもこのように答えました。それは明らかに誤解を招きます。

    返事
    0
  • 習慣沉默

    習慣沉默2017-05-18 10:53:02

    いくつかのモジュールコンポーネントが非推奨になり、代わりに同様のモジュールを使用できるようになりました

    返事
    0
  • 阿神

    阿神2017-05-18 10:53:02

    警告のみで、エラーはありません。もしかしたら、クロールしたWebサイトがクローラー対策されているため、正常に取得できなくなっている可能性があります。

    返事
    0
  • キャンセル返事