Rumah >pembangunan bahagian belakang >tutorial php >php怎么抓取网页中的数据

php怎么抓取网页中的数据

WBOYasal: 2016-06-13 10:06:121005semak imbas

php如何抓取网页中的数据？
比如,一个网站上有关于人名,地址,电话号码，掌握的语言等数据.
我想用程序去抓取语言掌握情况这类信息,但是掌握的语言不止一种，可能是两种、三种！并把它们存起来.

请问各位高手,如何用PHP实现这一功能呢?最好直接给个代码看看！。

------解决方案--------------------
可用curl　或 file_get_contents
会读取目标网站的html代码　然后你要自己根据他的代码来写正则提取出你想要的
没有具体的网页不太好给例子
------解决方案--------------------
curl+正则
------解决方案--------------------
我记得你，之前问过火车头的。其实这段代码火车头可以截取的，当然，你利用crul+正则也可以，正则的参考4楼就可以了，不过好像------解决方案--------------------
用字符串截取
------解决方案--------------------
写正则！
------解决方案--------------------
curl取数据，htmldom解析
------解决方案--------------------

探讨

可不可以给个具体点儿的啊！说的这么简单，还是不明白！对php这方面基本上是一窍不通啊‘
能不能把用到的关于curl的代码写给俺看看！不胜感激！！！！！！！！！！
还有这个curl+正则可以直接用到火车头采集器的接口插件中把？

------解决方案--------------------
CURL，百度一下，资料用法很多，正则就和PHP没傻关系了，任何语言都有！
我建议楼主可以自己多研究下，自己研究获得的东西一辈子都受用，而且还能提高自我解决问题的能力，如果在实际操作中遇到什么代码故障，再发帖出来讨论，这样更符合一个学者的精神！仅供参考，我多嘴了。呵呵！
------解决方案--------------------
curl+正则
------解决方案--------------------
读取远程的url
然后用正则匹配
得到结果
你可以存到数据库，或者文件中
------解决方案--------------------
给你说思路了，你就要研究下去
上面已经给你说的很具体了！
研究下吧
------解决方案--------------------
一般都是Curl＋正则，目前我在用java的一个开源的程序，楼主可以参考。
我的blog有关于这个使用的，是抓取火影忍者漫画的。
http://web-harvest.sourceforge.net/index.php

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：wordpress 链接有关问题Artikel seterusnya：fpdf一个有关问题

Artikel berkaitan

Lihat lagi