Heim >Backend-Entwicklung >PHP-Tutorial >Greifen Sie mit PHP auf eine Webseite zu und speichern Sie deren Inhalt in einer Datei

Greifen Sie mit PHP auf eine Webseite zu und speichern Sie deren Inhalt in einer Datei

PHPz
PHPzOriginal
2023-06-13 18:40:342097Durchsuche

Heute lernen wir, wie man mit PHP auf eine Webseite zugreift und deren Inhalt in einer lokalen Datei speichert. Diese Fähigkeit ist sehr nützlich für Crawling und Datenanalyse.

Zuerst müssen wir die Curl-Funktion in PHP verwenden, um den Inhalt der Webseite abzurufen. Curl ist eine Bibliothek, die für den Zugriff auf das Netzwerk verwendet werden kann und mehrere Protokolle wie HTTP, FTP, SMTP usw. unterstützen kann.

Wir erstellen zuerst eine PHP-Datei, die Beispieldatei heißt get_html.php, und fügen dann den folgenden Code zur Datei hinzu:

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 打印结果
echo $result;
?>

Im obigen Code definieren wir zuerst die URL, auf die zugegriffen werden soll, und initialisieren dann Curl mit die Funktion „curl_init()“. Als nächstes legen wir einige der oben genannten Parameter fest, z. B. die aufgerufene URL, die Rückgabe der Ergebnisse ohne Anzeige, keine Rückgabe von Header-Informationen usw. Abschließend führen wir die Anfrage mit der Funktion curl_exec() aus und speichern das Ergebnis in der Variablen $result. Abschließend drucken wir den Wert der Variablen $result aus, um den Inhalt dieser Webseite anzuzeigen.

Als nächstes müssen wir den Webinhalt in einer lokalen Datei speichern. Mit der Funktion file_put_contents() können wir String-Inhalte direkt in eine Datei schreiben. Es ist wichtig zu beachten, dass wir zuerst die Datei erstellen und dann den Inhalt in der Datei speichern müssen.

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 将结果保存到文件中
$file = 'page.html';
file_put_contents($file, $result);
?>

Im obigen Code definieren wir zunächst die URL, auf die zugegriffen werden soll, verwenden dann die Funktion „curl_init()“, um Curl zu initialisieren und einige Parameter festzulegen. Anschließend führen wir die Anfrage aus und speichern das Ergebnis in der Variablen $result. Schließlich verwenden wir die Funktion file_put_contents(), um den Wert der Variablen $result in einer Datei namens page.html zu speichern.

Okay, wir haben gelernt, wie man mit PHP auf eine Webseite zugreift und deren Inhalt in einer Datei speichert. Dies ist eine grundlegende Fähigkeit zum Daten-Scraping und zur Analyse. Ich hoffe, dieser Artikel wird Ihnen hilfreich sein.

Das obige ist der detaillierte Inhalt vonGreifen Sie mit PHP auf eine Webseite zu und speichern Sie deren Inhalt in einer Datei. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn