Maison > Questions et réponses > le corps du texte
现在需要抓取天猫详情页里面的月销量
如https://detail.tmall.com/item...
已分析得到是异步js返回的数据,接口如下
https://mdskip.taobao.com/cor...
这个地址访问几次就需要登录,登录之后多访问几次就需要输入验证码
用代理换IP也一样
各位大神有啥好办法
ringa_lee2017-04-18 10:31:07
Si vous ne vous connectez pas, changez d'agent directement
Ne gardez pas de session lors du changement de proxy
巴扎黑2017-04-18 10:31:07
Pour obtenir l'entrée, vous pouvez choisir l'entrée du terminal mobile, par exemple : entrée
Les données sont directement sur la page, il est très simple d'obtenir les données, mot-clé "sellCount"
.
阿神2017-04-18 10:31:07
Peu importe le nombre de fois que vous visitez le navigateur, il ne vous sera pas demandé de vous connecter. Utilisez le code pour ajuster le plug-in du navigateur afin d'accéder à htmlunit
Après avoir utilisé Postman 50 fois, il ne me permet toujours pas de me connecter ni d'afficher un code de vérification. J'essaierai mon prochain message, mais l'anti-crawling de Taobao est toujours moyen.
La méthode anti-crawling de https://www.endclothing.com est vraiment accablante