ホームページ  >  記事  >  バックエンド開発  >  PHP はクローラを作成できますか? (クローラ技術のPHP実装例)

PHP はクローラを作成できますか? (クローラ技術のPHP実装例)

藏色散人
藏色散人オリジナル
2019-04-18 14:26:4715528ブラウズ

php はクローラーとして使用できますか? PHP でクローラーを作成できますか? Web クローラーというと、誰もがまず Python をクローラーとして思い浮かべるはずです。実は、PHP は Web クローラー機能の実装にも使用できます。

ここでは、PHP を使用して簡単な Web クローラーを作成する方法を紹介します。

別の Web サイトからタグを取得してデータを解析するのは、実際には非常に簡単です。これは、以下に示すように、PHP 関数 file_get_contents を使用して実行できます。

<?php
$webpage = file_get_contents(&#39;http://www.tonylea.com&#39;);
?>

これで、変数 $webpage には http://www.tonylea.com のすべてが含まれます。タグ(ソース)。

基本的に、データを解析したい場合は、これを行います:

<?php
$url = &#39;http://www.tonylea.com&#39;;
$webpage = file_get_contents($url);
function get_images($page)
{
     if (!empty($page)){
          preg_match_all(&#39;/<img([^>]+)\/>/i&#39;, $page, $images);
          return !empty($images[1]) ? $images[1] : FALSE;
     }
}
function get_links($page)
{
     if (!empty($this->markup)){
          preg_match_all(&#39;/<a([^>]+)\>(.*?)\<\/a\>/i&#39;, $this->markup, $links);
          return !empty($links[1]) ? $links[1] : FALSE;
     }
}

$images = get_images($webpage);
foreach($images as $image)
{
     echo $image.&#39;<br />&#39;;
}
?>

上記の例では、指定された URL からタグを取得し、「a」タグとそれに含まれる値を取得しました。 「img」タグ内。次に、コードは「img」タグ内のデータを出力します。解析をさらに進めると、クロールされたページまたはクロールされたページから取得した画像とリンクを表示できます。

以上がPHP はクローラを作成できますか? (クローラ技術のPHP実装例)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。