网页爬虫 - Python requests.get 爬虫设置代理 IP地址未改变

Question

工作需要爬取亚马逊上面的信息，但是亚马逊反爬虫太厉害，同一个IP地址会被封。Python版本：3.6， IDE：Pycharm 2017.1在网上查了很多资料，requests库的手册也读过，但是都是同一个方法，代码如下： {代码...} ...

阿神 · Answer

proxies在你访问http时用http的设置，访问https时用https的设置
所以你的proxy需要同时包含http及https的配置，这样才能生效

proxy = {
    'http': 'http://117.85.105.170:808',
    'https': 'https://117.85.105.170:808'
}

网页爬虫 - Python requests.get 爬虫 设置代理 IP地址未改变