Heim >Web-Frontend >HTML-Tutorial >这个网页是如何取得实际数据的?_html/css_WEB-ITnose

这个网页是如何取得实际数据的?_html/css_WEB-ITnose

WBOY
WBOYOriginal
2016-06-24 11:44:321155Durchsuche

        我在做些从网页中采集数据的程序。例如股票数据吧,例如这个网页:
        http://stock.jrj.com.cn/share,600036.shtml
        可以看到页面一部分是这样的:
        

        我想把这些部分数据用程序采集下来:
        昨收:18.36元  最高:18.86元  涨停:20.20元
        今开:18.60元  最低:18.41元  跌停:16.52元

        数据采集的思路很容易,取回它的html,再分析提取就可以了。我希望取回的html是这样:
          ......
          

昨收:18.36元
          最高:18.86元
          涨停:20.20元
          ......
这样我就好做分析和提取了。但我检查了上述页面,它的html居然是这样的:
          ......
          昨收:--
          最高:--
          涨停:--
          ......
没有具体数据在html里面。我就没法从这个html提取我要的数据了。
        它的数据好像是调用不知道什么地方然后实时从网上取得的。因为如果我断开网络,打开这个html文件,它就是这样的情况:

        所有的数据都变“--”了。如果连上网络就正常了。我很想搞清楚这个网页到底是如何取得数据的?是调了哪个js函数吗?怎么知道是哪个?貌似跟标签有关?因为如果我去掉这些标签之后,不管有没有联网,浏览器显示也是上图这样了。但标签我百度了下,不是这是强调用只是影响字体的吗?怎么会跟数据有关系呢?我不太懂html和css,请大家指教,告诉我这个网页的实时数据是怎么取到的?非常感谢!


回复讨论(解决方案)

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036

这是用ajax技术做的
去看看ajax方面的资料你就明白了

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036


这个文章我也看过,但我要提取的不只是股票信息。我只是举个例子。我就是想有个办法提取像1楼那样网页的数据

这是ajax加载过来的,你要找到数据源(那些数据的真正url)

这是ajax加载过来的,你要找到数据源(那些数据的真正url)


我就是问如何找这些真正的数据源?

http://qmx.jrjimg.cn/stocks/pubdata/hotHqData.js

分析脚本
浏览器 f12 Network标签页 看记录

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn