python - 关于scrapy爬虫AJAX页面

Question

问题：爬取信息页面为：知乎话题广场 当点击加载的时候，用Chrome 开发者工具，可以看到Network中，实际请求的链接为：FormData为：urlencode： 然后我的代码为： {代码...} 执行爬虫之后，返回的是： {代码...} ...

伊谢尔伦 · Answer

DEBUG : Réessayer

伊谢尔伦 · Answer

L'écriture d'un robot doit être effectuée étape par étape, pas en une seule étape, sinon vous ne saurez pas ce qui ne va pas. Généralement, vous devez d'abord obtenir les données que vous souhaitez, puis analyser et filtrer.
Envoyez d'abord une demande pour voir si vous pouvez obtenir les données souhaitées. Sinon, l'URL peut être erronée ou interceptée

大家讲道理 · Answer

#coding=utf-8

import requests

headers = {'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8'}
url = 'https://www.zhihu.com/node/TopicsPlazzaListV2'
data = 'method=next¶ms=%7B%22topic_id%22%3A833%2C%22offset%22%3A0%2C%22hash_id%22%3A%22%22%7D'

r = requests.post(url, data, headers=headers)
print r.text

PHP中文网 · Answer

Le garçon vous apprend un grand mouvement.

python - 关于scrapy爬虫AJAX页面

répondre à tous(4)je répondrai