python - 如何爬取URL不变的网站内容

Question

{代码...} 对于这种翻页方式，怎么用爬虫爬取呢？网站翻页后URL没有发生改变。我之前使用bs4和selenium模拟翻页操作再爬取，可是数据量太大，这种方法速度太慢。80%的时间都浪费在翻页上。

高洛峰 · Answer

この問題は、Web サイトごとに個別に分析する必要があります。Web サイトごとに対応方法が異なります。
ここで、より一般的な状況でこのメソッドが使用できると仮定します。

HTTPリクエストをシミュレートする方法については、PythonでHTTPリクエストをシミュレートする方法を参照してください

天蓬老师 · Answer

AJAX リクエストがある可能性があります。リクエストを直接取得してください