>  기사  >  백엔드 개발  >  PHP가 크롤러를 작성할 수 있나요? (크롤러 기술의 PHP 구현 예)

PHP가 크롤러를 작성할 수 있나요? (크롤러 기술의 PHP 구현 예)

藏色散人
藏色散人원래의
2019-04-18 14:26:4715538검색

PHP를 크롤러로 사용할 수 있나요? PHP로 크롤러를 작성할 수 있나요? 웹 크롤러에 관해서라면 누구나 먼저 Python을 크롤러로 생각해야 합니다. 실제로 PHP는 웹 크롤러 기능을 구현하는 데에도 사용할 수 있습니다!

이제 PHP를 사용하여 간단한 웹 크롤러를 만드는 방법을 소개하겠습니다!

다른 웹사이트에서 태그를 가져와 데이터를 구문 분석하는 것은 실제로 매우 쉽습니다. 이는 아래와 같이 PHP 함수 file_get_contents를 통해 수행할 수 있습니다. file_get_contents来完成,如下所示:

<?php
$webpage = file_get_contents(&#39;http://www.tonylea.com&#39;);
?>

现在,变量$webpage

<?php
$url = &#39;http://www.tonylea.com&#39;;
$webpage = file_get_contents($url);
function get_images($page)
{
     if (!empty($page)){
          preg_match_all(&#39;/<img([^>]+)\/>/i&#39;, $page, $images);
          return !empty($images[1]) ? $images[1] : FALSE;
     }
}
function get_links($page)
{
     if (!empty($this->markup)){
          preg_match_all(&#39;/<a([^>]+)\>(.*?)\<\/a\>/i&#39;, $this->markup, $links);
          return !empty($links[1]) ? $links[1] : FALSE;
     }
}

$images = get_images($webpage);
foreach($images as $image)
{
     echo $image.&#39;<br />&#39;;
}
?>

이제 변수 $webpage에는 http://www가 포함됩니다. tonylea .com의 모든 태그(출처).

기본적으로 데이터를 구문 분석하려면 다음과 같이 합니다. 'a' 태그와 'img' 태그에 포함된 값. 그런 다음 코드는 "img" 태그의 데이터를 인쇄합니다. 더 많은 구문 분석을 통해 크롤링되거나 크롤링된 페이지에서 얻은 이미지와 링크를 표시할 수 있습니다.

위 내용은 PHP가 크롤러를 작성할 수 있나요? (크롤러 기술의 PHP 구현 예)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.