首頁  >  問答  >  主體

java - 教务系统爬虫问题(尚未解决)

最近在做一个查课表的网页,思路是用httpclient模拟用户登录,抓取课表页。现在遇见一个问题纠结了很久没有解决,望大神们给点帮助。

问题是:
青果的一类教务系统,我用F12查看网络请求,登录的post请求只提交了用户名,密码和验证码都是用MD5加密后提交的,于是我伪造了所有的请求参数(包括页面input里隐藏的参数,和MD5加密后的密码和验证码),并且对比了 “我伪造后的参数列表”和“浏览器登录成功的参数列表”完全一致,最后,却总是给我验证码错误的结果。

我测试过的没有问题的操作:

  1. 验证码获取正常(其他系统含验证码的能登录成功已经保证了是同一个回话,也用断点查看了获取验证码的httpClient和登录的是一个对象,并且登录时候用到了访问验证码返回的cookie)

  2. MD5加密的密码和验证码,我对比过相同验证码、用户名、密码在浏览器里面加密过后的密文和我自己程序生成的密文一致

用java的httpclient和php的curl都模拟过登录,java的一直都是返回验证码错误,php的返回的是下图的页面
也用chrome的插件advancedRequest,Firefox的插件httprequester尝试登录过,advancedRequest的结果跟php一样,httpRequester和java的结果一样

PHPzPHPz2761 天前755

全部回覆(3)我來回復

  • 大家讲道理

    大家讲道理2017-04-17 17:30:47

    帶著驗證碼登入的話,首先要造訪登入的頁面,拿到一個cookie,然後帶著cookie去存取驗證碼。最後帶著cookie發送post請求給伺服器。這樣就登入成功了。

    回覆
    0
  • PHP中文网

    PHP中文网2017-04-17 17:30:47

    一般都用md5加鹽

    回覆
    0
  • 怪我咯

    怪我咯2017-04-17 17:30:47

    額,我也在做青果的模擬登錄,你需要把前面獲取到的session在頭文件發到ValidateCode.aspx獲取驗證碼圖片才有效,你要保證同一個session(會話)。

    回覆
    0
  • 取消回覆