php如何抓取网页中的数据? 比如,一个网站上有关于人名,地址,电话号码,掌握的语言等数据. 我想用程序去抓取 语言掌握情况 这类信息,但是掌握的语言不止一种,可能是两种、三种!并把它们存起来. 请问各位高手,如何用PHP实现这一功能呢?最好直接给个代码看看!。------解决方案-------------------- 可用curl 或 file_get_contents 会读取目标网站的html代码 然后你要自己根据他的代码来写正则提取出你想要的 没有具体的网页不太好给例子------解决方案-------------------- curl+正则------解决方案-------------------- 我记得你,之前问过火车头的。其实这段代码火车头可以截取的,当然,你利用crul+正则也可以,正则的参考4楼就可以了,不过好像------解决方案-------------------- 用字符串截取------解决方案-------------------- 写正则!------解决方案-------------------- curl取数据,htmldom解析------解决方案--------------------
探讨
可不可以给个具体点儿的啊!说的这么简单,还是不明白!对php这方面基本上是一窍不通啊‘ 能不能把用到的关于curl的代码写给俺看看!不胜感激!!!!!!!!!! 还有这个curl+正则可以直接用到火车头采集器的接口插件中把?
------解决方案-------------------- CURL,百度一下,资料用法很多,正则就和PHP没傻关系了,任何语言都有!
我建议楼主可以自己多研究下,自己研究获得的东西一辈子都受用,而且还能提高自我解决问题的能力,如果在实际操作中遇到什么代码故障,再发帖出来讨论,这样更符合一个学者的精神!仅供参考,我多嘴了。呵呵!
------解决方案-------------------- curl+正则
------解决方案-------------------- 读取远程的url
然后用正则匹配
得到结果
你可以存到数据库,或者文件中
------解决方案-------------------- 给你说思路了,你就要研究下去
上面已经给你说的很具体了!
研究下吧
------解决方案-------------------- 一般都是Curl+正则,目前我在用java的一个开源的程序,楼主可以参考。
我的blog有关于这个使用的,是抓取火影忍者漫画的。
http://web-harvest.sourceforge.net/index.php
Stellungnahme: Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn