suchen

Heim  >  Fragen und Antworten  >  Hauptteil

So crawlen Sie js-verarbeiteten Code in Java

Seitenadresse:
http://acm.hdu.edu.cn/showpro...

Crawling-Ziel:

Wenn Sie den Code dieser Formeln crawlen möchten, ChromeF12Der Code, den Sie gesehen haben:

Der gecrawlte Code lautet jedoch wie folgt:

Dieser Code zeigt nicht die richtige Formel an. Es scheint, dass diese Codes alle von js generiert wurden.

为情所困为情所困2782 Tage vor657

Antworte allen(2)Ich werde antworten

  • 黄舟

    黄舟2017-05-17 10:06:18

    这是MathJax工具解析的。
    在HTML代码中查看公式p的下一个id为MathJax-Element-X的script,复制里面的内容,在公式前后加两个$$(前后都是两个美元符,所以一共是四个)最后使用MathJax解析就可以了。
    说再多不如上图:

    Antwort
    0
  • 阿神

    阿神2017-05-17 10:06:18

    先抓包,把ajax请求抓出来,关键是看怎么构造该请求,主要是一些参数的确定。套路大概下面几个:1 在上下文搜搜相关参数是否存在,如果是服务器返回的,就直接请求服务器获得该参数;2 如果该参数很明显不变或者变化有规律,可以直接伪造;3 如果参数很复杂且没规律,那么需要搜索参数的key,找到加密的js,然后构造参数的值,得到ajax url;4 实在难度太大那么用selenium等自动化工具驱动浏览器来访问,它会直接给你渲染好所有js

    Antwort
    0
  • StornierenAntwort