Heim >Backend-Entwicklung >PHP-Tutorial >Kann PHP Crawler schreiben? (Beispiel einer PHP-Implementierung der Crawler-Technologie)

Kann PHP Crawler schreiben? (Beispiel einer PHP-Implementierung der Crawler-Technologie)

藏色散人
藏色散人Original
2019-04-18 14:26:4715568Durchsuche

Kann PHP als Crawler verwendet werden? Kann ich einen Crawler in PHP schreiben? Wenn es um Webcrawler geht, muss jeder zuerst an Python als Crawler denken. Tatsächlich kann PHP auch zur Implementierung von Webcrawler-Funktionen verwendet werden!

Jetzt stellen wir Ihnen vor, wie Sie mit PHP einen einfachen Webcrawler erstellen!

Es ist tatsächlich sehr einfach, einen Tag von einer anderen Website zu erhalten und die Daten zu analysieren. Dies kann über eine PHP-Funktion file_get_contents erfolgen, wie unten gezeigt:

<?php
$webpage = file_get_contents(&#39;http://www.tonylea.com&#39;);
?>

Jetzt enthält die Variable $webpage alle Tags (Quelle) von http://www.tonylea.com.

Wenn wir die Daten analysieren möchten, gehen wir grundsätzlich wie folgt vor:

<?php
$url = &#39;http://www.tonylea.com&#39;;
$webpage = file_get_contents($url);
function get_images($page)
{
     if (!empty($page)){
          preg_match_all(&#39;/<img([^>]+)\/>/i&#39;, $page, $images);
          return !empty($images[1]) ? $images[1] : FALSE;
     }
}
function get_links($page)
{
     if (!empty($this->markup)){
          preg_match_all(&#39;/<a([^>]+)\>(.*?)\<\/a\>/i&#39;, $this->markup, $links);
          return !empty($links[1]) ? $links[1] : FALSE;
     }
}

$images = get_images($webpage);
foreach($images as $image)
{
     echo $image.&#39;<br />&#39;;
}
?>

Im obigen Beispiel erhalten wir das Tag von der angegebenen URL und erhalten das Tag „a“ und den enthaltenen Wert im 'img'-Tag. Der Code gibt dann die Daten im „img“-Tag aus. Mit mehr Parsing können Sie Bilder und Links anzeigen, die von gecrawlten oder gecrawlten Seiten stammen.

Das obige ist der detaillierte Inhalt vonKann PHP Crawler schreiben? (Beispiel einer PHP-Implementierung der Crawler-Technologie). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn