python - 如何爬取带有日期选择的ajax网站？

Question

需要爬取三峡水库的实时水情数据，可以在网页中选择日期显示水情信息，如果一天天选择再复制数据发现很是耗时，我现在需要将下图中三峡水利枢纽2014年-2016年每天的数据爬下来。 网址如下：http://www.ctgpc.com....

伊谢尔伦 · Answer

可以利用requests库模拟post提交。从游览器检查工具可以看到传的参数是time:2017-02-07。定义data={"time": 日期譬如2017-02-07}。然后你可以写个循环，循环一次日期往后加一天。然后就r = requests.post("url", data=data, header=****)。取出数据保存入库。每次循环嫌慢的话，可以加上gevent这个协程库加快速度，看你也就想抓2年的数据循环365*2次就OK了

伊谢尔伦 · Answer

你已经看到了那个包含数据的请求，那么你的问题是什么呢？

迷茫 · Answer

抓包，再模拟post或get
看看下面的内容
Python爬虫联想词视频和代码
https://zhuanlan.zhihu.com/p/...

跟黄哥学Python爬虫抓取代理IP和验证。
https://zhuanlan.zhihu.com/p/...
跟黄哥学Python爬虫抓取代理IP
https://zhuanlan.zhihu.com/p/...

PHP中文网 · Answer

都已经拿到Json串了，数据更好拿了啊

python - 如何爬取带有日期选择的ajax网站？

全部回复(4)我来回复