Heim  >  Artikel  >  Backend-Entwicklung  >  Bewerten Sie die Effizienz und Stabilität von file_get_contents und Curl

Bewerten Sie die Effizienz und Stabilität von file_get_contents und Curl

高洛峰
高洛峰Original
2016-10-17 11:04:311338Durchsuche

Ich habe an vielen Produkten gearbeitet, die Inhalte von anderen Websites erfassen, und bin es gewohnt, die praktische und schnelle Funktion „file_get_contents“ zu verwenden, aber ich stoße immer auf das Problem, dass ich sie nicht abrufen kann, obwohl ich das Zeitlimit entsprechend eingestellt habe Beispiele im Handbuch, es funktioniert die meiste Zeit nicht:

$config[&#39;context&#39;] = stream_context_create(array(‘http’ =< array(‘method’ =< “GET”,
   ’timeout’ =< 5//这个超时时间不稳定,经常不奏效
   )
  ));

Wenn Sie sich zu diesem Zeitpunkt den Verbindungspool des Servers ansehen, werden Sie eine Reihe ähnlicher Fehler finden, die Ihnen angezeigt werden Kopfschmerzen:

file_get_contents(http://***): failed to open stream…

Als letzten Ausweg habe ich die Curl-Bibliothek installiert und einen Funktionsersatz geschrieben:

function curl_file_get_contents($durl){
    $ch=curl_init();
    curl_setopt($ch, CURLOPT_URL,$durl);
    curl_setopt($ch, CURLOPT_TIMEOUT,5);
    curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);
    curl_setopt($ch, CURLOPT_REFERER,_REFERER_);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
    $r=curl_exec($ch);
    curl_close($ch);
    return $r;
}

Auf diese Weise sind bis auf echte Netzwerkprobleme keine Probleme aufgetreten.

Dies ist ein von anderen durchgeführter Test zu Curl und file_get_contents:

Die Anzahl der Sekunden, die file_get_contents zum Crawlen von google.com benötigt:

2,31319094

2,30374217

2,21512604

3,30553889

2,30124092

Curl-Nutzungszeit:

0,68719101

0,646

0,64326

0,81983113

0,63956594

Gibt es da nicht eine große Lücke? Haha, meiner Erfahrung nach unterscheiden sich diese beiden Tools nicht nur in der Geschwindigkeit, sondern auch in der Stabilität. Freunden, die hohe Anforderungen an die Stabilität der Netzwerkdatenerfassung haben, wird empfohlen, die obige Funktion „curl_file_get_contents“ zu verwenden. Sie ist nicht nur stabil und schnell, sie kann auch den Browser fälschen und die Zieladresse fälschen!


Besondere Achtung: Verschiedene PHP-Versionen können unterschiedliche Testergebnisse haben. Unter PHP5.2 ist die Funktion file_get_contents besonders ineffizient und neigt dazu, zu viel CPU zu beanspruchen Upgrade auf PHP5.3, nach dem Test gibt es unter PHP5.3 kein solches Problem


Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn