>백엔드 개발 >PHP 튜토리얼 > PHP深层扫描,该怎么处理

PHP深层扫描,该怎么处理

WBOY
WBOY원래의
2016-06-13 13:18:51846검색

PHP深层扫描
我想抓取网页中的内容时
file_get_contents 参数填入url就可以获得当前的内容

现在我想做的是如何深层抓取?

难道是遇到 a标签后 就获取url 然后再file_get_contents

一直这么遍历下去吗??

不知道有没好的思路呢?

------解决方案--------------------
爬虫么?
不外乎两种常见的遍历形式:
1.深度扫描,类似图的深度遍历。递归是最容易理解的方式。

2.广度扫描。即按照层次的方式来扫描网页。容易实现且可以控制抓取的层次。

你说的方式基本就是深度爬虫的策略。ps:这个相当耗时额。

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.