网页爬虫 - Python使用requests库搜到的图片src下的url是正在加载的图片

Question

我想下载http://www.chuiyao.com/manhua/3670/393022.html里面的图片，但用下面的代码搜到的图片是这个http://www.chuiyao.com/static/skin5/images/pic_loading.gif。headers我是用的chrome浏览器network下的393...

高洛峰 · Answer

图片是js动态加载的，你的爬虫只是获取了静态页面。

主要的加载图片的功能在这个js文件里：

www.chuiyao.com/static/skin5/js/wdshow.js?v=20160713.1

你自己用python的相关模块来模拟该js的功能，即可解析出图片地址。

PHP中文网 · Answer

img 标签的内容是通过调用 js 的 Show_Pic_w() 方法在页面加载完成后动态替换的，你用 python 是获取不到和浏览器一样的页面的

网页爬虫 - Python使用requests库搜到的图片src下的url是正在加载的图片

全部回复(2)我来回复