搜尋

首頁  >  問答  >  主體

php - snoopy爬蟲 報錯405 Not Allowed

代碼

$httpClass = new Snoopy();
$httpClass->fetch('https://v.qq.com/');
$url = $httpClass->results;
print_r($url);die() ;

爬取https://www.baidu.com/就一直報405錯誤

爬取https://v.qq.com/ 是正常運作的

求解答,弄了一下午都沒解決

高洛峰高洛峰2843 天前642

全部回覆(2)我來回復

  • 淡淡烟草味

    淡淡烟草味2017-05-16 13:00:40

    百度估計是做了仿爬蟲的設定了,你要進行偽裝,定義一個UA之類的
    參考: http://www.4wei.cn/archives/396

    回覆
    0
  • 天蓬老师

    天蓬老师2017-05-16 13:00:40

    這個不是Snoopy類別的問題。是你不太了解爬蟲的相關知識。既然有爬蟲,當然就會有反爬蟲的技術。最簡單的就是基於瀏覽器標識或是請求頭header中的referer等等。百度和騰訊這種大站是不會想我們爬取數據的,一定做了很多防範措施。所以建議在爬取資料之前先了解下爬蟲的知識。

    回覆
    0
  • 取消回覆