搜索

首页  >  问答  >  正文

python爬虫防封IP的方法应该放到代码的哪个位置

想要爬豆瓣电影,但是很容易403,就想代理IP或者修改请求头,但是看了很多资料,不知道他们那些代码应该放到整个程序的哪个位置,我用的是美丽汤和request,应该增添什么代码,增添到什么位置

PHPzPHPz2781 天前762

全部回复(2)我来回复

  • PHP中文网

    PHP中文网2017-04-18 10:21:18

    BeautifulSoup的中文名原来叫美丽汤。。。

    吐槽完毕,服务端一般是通过IP报文来检测请求的IP的地址的,所以单纯的修改HTTP请求的内容一般来说是不起作用的,最好的方式是使用 Requests 的代理功能来进行访问,可以解除 IP 限制的问题。

    回复
    0
  • 巴扎黑

    巴扎黑2017-04-18 10:21:18

    请看看
    Python爬虫联想词视频和代码
    https://zhuanlan.zhihu.com/p/...

    跟黄哥学Python爬虫抓取代理IP和验证。
    https://zhuanlan.zhihu.com/p/...
    跟黄哥学Python爬虫抓取代理IP
    https://zhuanlan.zhihu.com/p/...

    回复
    0
  • 取消回复