検索

ホームページ  >  に質問  >  本文

PC アクセスがモバイルアドレスの問題になっている#python#scrapy

scrapy を使用して Himalaya をクロールし、PC アドレスをクロールします。エントリ リンクの応答は問題ありませんが、その後の応答にはモバイル アドレスが表示されます。 。 。 。

スパイダーコードは次のとおりです:

リーリー

コンソール出力:

middlewares.RotateUserAgentMiddleware を書きましたが、これは効果的で、出力内容も確認できます。

クロール防止メカニズムが作動しているのでしょうか?

淡淡烟草味淡淡烟草味2823日前1150

全員に返信(2)返信します

  • 高洛峰

    高洛峰2017-06-30 09:57:13

    ヘッダーにユーザーエージェントが設定されていないためです

    返事
    0
  • 欧阳克

    欧阳克2017-06-30 09:57:13

    リクエストヘッダーを慎重に設定してください。通常、モバイル端末かどうかの判断はユーザーエージェントに依存します
    何もせずにデータにアクセスできますが、これはターゲット Web サイトがホットリンク対策にあまり注意を払っていないことも示しています

    返事
    0
  • キャンセル返事