php如何抓取网页中的数据? 比如,一个网站上有关于人名,地址,电话号码,掌握的语言等数据. 我想用程序去抓取 语言掌握情况 这类信息,但是掌握的语言不止一种,可能是两种、三种!并把它们存起来. 请问各位高手,如何用PHP实现这一功能呢?最好直接给个代码看看!。------解决方案-------------------- 可用curl 或 file_get_contents 会读取目标网站的html代码 然后你要自己根据他的代码来写正则提取出你想要的 没有具体的网页不太好给例子------解决方案-------------------- curl+正则------解决方案-------------------- 我记得你,之前问过火车头的。其实这段代码火车头可以截取的,当然,你利用crul+正则也可以,正则的参考4楼就可以了,不过好像------解决方案-------------------- 用字符串截取------解决方案-------------------- 写正则!------解决方案-------------------- curl取数据,htmldom解析------解决方案--------------------
探讨
可不可以给个具体点儿的啊!说的这么简单,还是不明白!对php这方面基本上是一窍不通啊‘ 能不能把用到的关于curl的代码写给俺看看!不胜感激!!!!!!!!!! 还有这个curl+正则可以直接用到火车头采集器的接口插件中把?
------解决方案-------------------- CURL,百度一下,资料用法很多,正则就和PHP没傻关系了,任何语言都有!
我建议楼主可以自己多研究下,自己研究获得的东西一辈子都受用,而且还能提高自我解决问题的能力,如果在实际操作中遇到什么代码故障,再发帖出来讨论,这样更符合一个学者的精神!仅供参考,我多嘴了。呵呵!
------解决方案-------------------- curl+正则
------解决方案-------------------- 读取远程的url
然后用正则匹配
得到结果
你可以存到数据库,或者文件中
------解决方案-------------------- 给你说思路了,你就要研究下去
上面已经给你说的很具体了!
研究下吧
------解决方案-------------------- 一般都是Curl+正则,目前我在用java的一个开源的程序,楼主可以参考。
我的blog有关于这个使用的,是抓取火影忍者漫画的。
http://web-harvest.sourceforge.net/index.php
Kenyataan: Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn