Python - Scrapy の settings.py で USER_AGENT が有効になっているのに何も収集できないのはなぜですか?レベルを閉じると、Web ページを収集できます。

Question

Baidu Tieba から収集 python 2.7.11scrapy 1.3.3 settings.py で user_agent が有効になっている限り、次のいずれの方法が使用されても問題ありません。何も選ぶことができませんでした。そして、この user_agent をオフにします。どれも普通に回収できます。これは変ですか？理由が分かりませんか？ユーザーエージェント ...

为情所困 · Answer

クロールした Web サイトにはクローラー対策が講じられている可能性があります

巴扎黑 · Answer

クロール防止後、Scrapy は独自に定義された useragent を有効にすると、先頭に追加されます。
模倣する useragent プールを作成することをお勧めします。ブラウザを定期的またはランダムに置き換えて、最も安全です

大家讲道理 · Answer

User_Agent ではなく、User-Agent です。以前にもこの問題がありましたが、後で変更しただけです

Python - Scrapy の settings.py で USER_AGENT が有効になっているのに何も収集できないのはなぜですか?レベルを閉じると、Web ページを収集できます。

全員に返信(3)返信します