Heim  >  Artikel  >  Backend-Entwicklung  >  网页爬虫 - php如何通过curl模拟登录带验证码站点并抓取数据?

网页爬虫 - php如何通过curl模拟登录带验证码站点并抓取数据?

WBOY
WBOYOriginal
2016-08-04 09:19:442544Durchsuche

现要模拟登录一个带验证码的站点(模拟一个登录页面,手动输入验证码),并实时采集订单数据。能否提供一个思路?

  1. 验证码图片是否需要curl带cookie抓取,保存到本地,然后显示在页面上?
    2.我现在的做法是模拟登录页面的验证码图片直接设置img的src为远程链接,这样貌似导致了我抓取到本地的cookie和浏览器缓存的cookie不一致,登录结果会显示登录超时

回复内容:

现要模拟登录一个带验证码的站点(模拟一个登录页面,手动输入验证码),并实时采集订单数据。能否提供一个思路?

  1. 验证码图片是否需要curl带cookie抓取,保存到本地,然后显示在页面上?
    2.我现在的做法是模拟登录页面的验证码图片直接设置img的src为远程链接,这样貌似导致了我抓取到本地的cookie和浏览器缓存的cookie不一致,登录结果会显示登录超时

一般来说是访问login页面,保存cookie,用这个cookie去请求验证码,然后把账号、密码、cookie、验证码一起post过去

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn