>웹 프론트엔드 >HTML 튜토리얼 >这个网页是如何取得实际数据的?_html/css_WEB-ITnose

这个网页是如何取得实际数据的?_html/css_WEB-ITnose

WBOY
WBOY원래의
2016-06-24 11:44:321155검색

        我在做些从网页中采集数据的程序。例如股票数据吧,例如这个网页:
        http://stock.jrj.com.cn/share,600036.shtml
        可以看到页面一部分是这样的:
        

        我想把这些部分数据用程序采集下来:
        昨收:18.36元  最高:18.86元  涨停:20.20元
        今开:18.60元  最低:18.41元  跌停:16.52元

        数据采集的思路很容易,取回它的html,再分析提取就可以了。我希望取回的html是这样:
          ......
          

昨收:18.36元
          最高:18.86元
          涨停:20.20元
          ......
这样我就好做分析和提取了。但我检查了上述页面,它的html居然是这样的:
          ......
          昨收:--
          最高:--
          涨停:--
          ......
没有具体数据在html里面。我就没法从这个html提取我要的数据了。
        它的数据好像是调用不知道什么地方然后实时从网上取得的。因为如果我断开网络,打开这个html文件,它就是这样的情况:

        所有的数据都变“--”了。如果连上网络就正常了。我很想搞清楚这个网页到底是如何取得数据的?是调了哪个js函数吗?怎么知道是哪个?貌似跟标签有关?因为如果我去掉这些标签之后,不管有没有联网,浏览器显示也是上图这样了。但标签我百度了下,不是这是强调用只是影响字体的吗?怎么会跟数据有关系呢?我不太懂html和css,请大家指教,告诉我这个网页的实时数据是怎么取到的?非常感谢!


回复讨论(解决方案)

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036

这是用ajax技术做的
去看看ajax方面的资料你就明白了

http://www.cnblogs.com/me115/archive/2011/05/09/2040826.html
http://hq.sinajs.cn/list=sh600036


这个文章我也看过,但我要提取的不只是股票信息。我只是举个例子。我就是想有个办法提取像1楼那样网页的数据

这是ajax加载过来的,你要找到数据源(那些数据的真正url)

这是ajax加载过来的,你要找到数据源(那些数据的真正url)


我就是问如何找这些真正的数据源?

http://qmx.jrjimg.cn/stocks/pubdata/hotHqData.js

分析脚本
浏览器 f12 Network标签页 看记录

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.