検索

ホームページ  >  に質問  >  本文

php - スヌーピー クローラーがエラー 405 を報告します 許可されていません

コード

$httpClass = new Snoopy();
$httpClass->fetch('https://v.qq.com/');
$url = $httpClass->results;
print_r($url);die();

https://www.baidu.com/ をクロールすると 405 エラーが報告され続けます

https://v.qq.com/ のクロールは正常に実行されています

答えを探して、午後ずっと取り組んでいますが、まだ解決できません

高洛峰高洛峰2756日前623

全員に返信(2)返信します

  • 淡淡烟草味

    淡淡烟草味2017-05-16 13:00:40

    Baidu にはおそらくクローラーのような設定があるので、それを偽装して UA などを定義する必要があります
    参考: http://www.4wei.cn/archives/396

    返事
    0
  • 天蓬老师

    天蓬老师2017-05-16 13:00:40

    これはスヌーピータイプの問題ではありません。クローラーについてあまり知らないからです。クローラーが存在するので、当然、対クローラー技術も存在します。最も単純なものは、ブラウザ識別子またはリクエスト ヘッダー内のリファラーなどに基づきます。 Baidu や Tencent のような大手 Web サイトは、私たちがデータをクロールすることを望まないため、多くの予防策を講じているはずです。したがって、データをクロールする前に、クローラーの知識を理解することをお勧めします。

    返事
    0
  • キャンセル返事