搜尋

首頁  >  問答  >  主體

python爬虫防封IP的方法应该放到代码的哪个位置

想要爬豆瓣电影,但是很容易403,就想代理IP或者修改请求头,但是看了很多资料,不知道他们那些代码应该放到整个程序的哪个位置,我用的是美丽汤和request,应该增添什么代码,增添到什么位置

PHPzPHPz2777 天前756

全部回覆(2)我來回復

  • PHP中文网

    PHP中文网2017-04-18 10:21:18

    BeautifulSoup的中文名原來叫做美麗湯。 。 。

    吐槽完畢,服務端一般是透過IP封包來偵測請求的IP的位址的,所以單純的修改HTTP請求的內容一般來說是不起作用的,最好的方式是使用Requests 的代理功能來進行訪問,可以解除IP 限制的問題。

    回覆
    0
  • 巴扎黑

    巴扎黑2017-04-18 10:21:18

    請看
    Python爬蟲聯想詞影片和程式碼
    https://zhuanlan.zhihu.com/p/...

    跟黃哥學Python爬蟲抓取代理IP和驗證。
    https://zhuanlan.zhihu.com/p/...
    跟黃哥學Python爬蟲抓取代理IP
    https://zhuanlan.zhihu.com/p/...

    回覆
    0
  • 取消回覆