Maison  >  Questions et réponses  >  le corps du texte

python - 抓取天猫详情页里面的月销量,反爬非常厉害

现在需要抓取天猫详情页里面的月销量
如https://detail.tmall.com/item...

已分析得到是异步js返回的数据,接口如下
https://mdskip.taobao.com/cor...


这个地址访问几次就需要登录,登录之后多访问几次就需要输入验证码
用代理换IP也一样
各位大神有啥好办法

天蓬老师天蓬老师2741 Il y a quelques jours887

répondre à tous(4)je répondrai

  • ringa_lee

    ringa_lee2017-04-18 10:31:07

    Si vous ne vous connectez pas, changez d'agent directement

    Ne gardez pas de session lors du changement de proxy

    répondre
    0
  • 巴扎黑

    巴扎黑2017-04-18 10:31:07

    Pour obtenir l'entrée, vous pouvez choisir l'entrée du terminal mobile, par exemple : entrée


    Les données sont directement sur la page, il est très simple d'obtenir les données, mot-clé "sellCount".

    répondre
    0
  • 阿神

    阿神2017-04-18 10:31:07

    Peu importe le nombre de fois que vous visitez le navigateur, il ne vous sera pas demandé de vous connecter. Utilisez le code pour ajuster le plug-in du navigateur afin d'accéder à htmlunit

    Après avoir utilisé Postman 50 fois, il ne me permet toujours pas de me connecter ni d'afficher un code de vérification. J'essaierai mon prochain message, mais l'anti-crawling de Taobao est toujours moyen.
    La méthode anti-crawling de https://www.endclothing.com est vraiment accablante

    répondre
    0
  • 天蓬老师

    天蓬老师2017-04-18 10:31:07

    Quelqu’un a-t-il une expérience avec cela ?

    répondre
    0
  • Annulerrépondre