>백엔드 개발 >PHP 튜토리얼 >网页爬虫 - PHP网络爬虫

网页爬虫 - PHP网络爬虫

WBOY
WBOY원래의
2016-06-06 20:48:161089검색

想用PHP写个数据采集的程序,不知道有没有库推荐?

回复内容:

想用PHP写个数据采集的程序,不知道有没有库推荐?

snoopy库 这里是介绍,可以去看看

很少有人推荐simple_html_dom吗?
http://simplehtmldom.sourceforge.net/
看看他的description:

<code>A HTML DOM parser written in PHP5+ let you manipulate HTML in a very easy way!
Require PHP 5+.
Supports invalid HTML.
Find tags on an HTML page with selectors just like jQuery.
Extract contents from HTML in a single line.
</code>

phpQuery不错

可以用Phpfetcher:Phpfetcher
很简单,没有其它依赖,而且里面的例子都是直接就能运行的
例子里面包括爬取腾讯新闻,爬取百度搜索结果等,可以看一下

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.