検索

ホームページ  >  に質問  >  本文

java - 教务系统爬虫问题(尚未解决)

最近在做一个查课表的网页,思路是用httpclient模拟用户登录,抓取课表页。现在遇见一个问题纠结了很久没有解决,望大神们给点帮助。

问题是:
青果的一类教务系统,我用F12查看网络请求,登录的post请求只提交了用户名,密码和验证码都是用MD5加密后提交的,于是我伪造了所有的请求参数(包括页面input里隐藏的参数,和MD5加密后的密码和验证码),并且对比了 “我伪造后的参数列表”和“浏览器登录成功的参数列表”完全一致,最后,却总是给我验证码错误的结果。

我测试过的没有问题的操作:

  1. 验证码获取正常(其他系统含验证码的能登录成功已经保证了是同一个回话,也用断点查看了获取验证码的httpClient和登录的是一个对象,并且登录时候用到了访问验证码返回的cookie)

  2. MD5加密的密码和验证码,我对比过相同验证码、用户名、密码在浏览器里面加密过后的密文和我自己程序生成的密文一致

用java的httpclient和php的curl都模拟过登录,java的一直都是返回验证码错误,php的返回的是下图的页面
也用chrome的插件advancedRequest,Firefox的插件httprequester尝试登录过,advancedRequest的结果跟php一样,httpRequester和java的结果一样

PHPzPHPz2796日前782

全員に返信(3)返信します

  • 大家讲道理

    大家讲道理2017-04-17 17:30:47

    確認コードを使用してログインする場合は、まずログイン ページにアクセスして Cookie を取得し、次にその Cookie を使用して確認コードにアクセスする必要があります。最後に、Cookie を使用して投稿リクエストをサーバーに送信します。ログインは成功しました。

    返事
    0
  • PHP中文网

    PHP中文网2017-04-17 17:30:47

    通常は、MD5 と塩を使用します

    返事
    0
  • 怪我咯

    怪我咯2017-04-17 17:30:47

    そうですね、Qingguo のシミュレートされたログインも実行しています。検証コード イメージを有効にするために、以前に取得したセッション ヘッダー ファイルを ValidateCode.aspx に送信する必要があります。それが同じセッション (セッション) であることを確認する必要があります。

    返事
    0
  • キャンセル返事