Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Akses halaman web dengan PHP dan simpan kandungannya dalam fail

Akses halaman web dengan PHP dan simpan kandungannya dalam fail

PHPz
PHPzasal
2023-06-13 18:40:341991semak imbas

Hari ini kita akan belajar cara menggunakan PHP untuk mengakses halaman web dan menyimpan kandungannya ke fail setempat. Kemahiran ini sangat berguna untuk merangkak dan analisis data.

Pertama, kita perlu menggunakan fungsi curl dalam PHP untuk mendapatkan kandungan halaman web. curl ialah perpustakaan yang boleh digunakan untuk mengakses rangkaian dan boleh menyokong pelbagai protokol seperti HTTP, FTP, SMTP, dll.

Kami mula-mula mencipta fail PHP, fail contoh dipanggil get_html.php, dan kemudian tambah kod berikut dalam fail:

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 打印结果
echo $result;
?>

Dalam kod di atas, kami mula-mula menentukan URL untuk diakses, Kemudian mulakan curl dengan fungsi curl_init(). Seterusnya, kami menetapkan beberapa parameter yang dinyatakan di atas, seperti URL untuk diakses, mengembalikan hasil tanpa memaparkannya, tidak mengembalikan maklumat pengepala, dsb. Akhir sekali, kami melaksanakan permintaan dengan fungsi curl_exec() dan menyimpan hasilnya dalam pembolehubah $result. Akhir sekali, kami mencetak nilai pembolehubah $result untuk melihat kandungan halaman web ini.

Seterusnya, kami mahu menyimpan kandungan web ke dalam fail setempat. Kita boleh menggunakan fungsi file_put_contents() untuk menulis kandungan rentetan terus ke fail. Adalah penting untuk ambil perhatian bahawa kita perlu membuat fail terlebih dahulu dan kemudian menyimpan kandungan ke fail.

<?php
// 获取网址
$url = 'http://www.example.com';

// 初始化 curl
$ch = curl_init();

// 设置参数
curl_setopt($ch, CURLOPT_URL, $url);  // 设置访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将结果返回而不显示
curl_setopt($ch, CURLOPT_HEADER, false); // 不返回头信息

// 发送请求
$result = curl_exec($ch);

// 关闭 curl
curl_close($ch);

// 将结果保存到文件中
$file = 'page.html';
file_put_contents($file, $result);
?>

Dalam kod di atas, kami mula-mula menentukan URL untuk diakses, kemudian gunakan fungsi curl_init() untuk memulakan curl dan menetapkan beberapa parameter. Kami kemudian melaksanakan permintaan dan menyimpan hasilnya dalam pembolehubah $result. Akhir sekali, kami menggunakan fungsi file_put_contents() untuk menyimpan nilai pembolehubah $result ke fail yang dipanggil page.html.

Baiklah, kami telah mempelajari cara menggunakan PHP untuk mengakses halaman web dan menyimpan kandungannya ke dalam fail. Ini adalah kemahiran asas untuk mengikis dan analisis data saya harap artikel ini akan membantu anda.

Atas ialah kandungan terperinci Akses halaman web dengan PHP dan simpan kandungannya dalam fail. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn