python - 如何爬取带有日期选择的ajax网站？

Question

需要爬取三峡水库的实时水情数据，可以在网页中选择日期显示水情信息，如果一天天选择再复制数据发现很是耗时，我现在需要将下图中三峡水利枢纽2014年-2016年每天的数据爬下来。 网址如下：http://www.ctgpc.com....

伊谢尔伦 · Answer

リクエストライブラリを使用して投稿の送信をシミュレートできます。ブラウザー検査ツールから、渡されたパラメーターが time:2017-02-07 であることがわかります。 data={"time": 2017-02-07 などの日付} を定義します。次に、日付をループして日付に 1 日を追加するループを作成できます。それではr = requests.post("url", data=data, header=****)。データを取り出してデータベースに保存します。各サイクルが遅すぎる場合は、コルーチンライブラリ gevent を追加して速度を上げることができます。2 年分のデータをキャプチャしたい場合は、365*2 回サイクルすれば問題ありません

。

伊谢尔伦 · Answer

そのリクエストをデータで確認しましたが、質問は何ですか?

迷茫 · Answer

パケットをキャプチャして、投稿または取得をシミュレートします
以下の内容をご覧ください
Python クローラー関連付けワードのビデオとコード
https://zhuanlan.zhihu.com/p/...

Brother Huang からプロキシ IP と検証をキャプチャするための Python クローラーを学びます。
https://zhuanlan.zhihu.com/p/...
Huang Ge からプロキシ IP をキャプチャするための Python クローラーを学習します
https://zhuanlan.zhihu.com/p/...

PHP中文网 · Answer

すでにJson文字列を取得しているため、データを取得するのが簡単です

python - 如何爬取带有日期选择的ajax网站？

全員に返信(4)返信します