Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara Mengikis Halaman Web dengan PHP: Panduan Langkah demi Langkah

Cara Mengikis Halaman Web dengan PHP: Panduan Langkah demi Langkah

Barbara Streisand
Barbara Streisandasal
2024-11-16 18:09:03192semak imbas

How to Scrape Webpages with PHP: A Step-by-Step Guide

Mengikis Web dengan PHP: Panduan Langkah demi Langkah

Mengikis web melibatkan mendapatkan semula data khusus daripada tapak web untuk menyimpan atau menganalisis secara luaran. Untuk melaksanakan pengikisan web dalam PHP, tiga langkah utama terlibat:

Langkah 1: Mengambil Halaman Web

PHP menyediakan fungsi terbina dalam untuk membuat permintaan HTTP dan menerima respons , termasuk:

  • curl_init(): Memulakan sesi cURL.
  • curl_setopt(): Menetapkan pilihan cURL, seperti URL sasaran, kaedah HTTP dan pengepala.
  • curl_exec() : Melaksanakan cURL permintaan.

Langkah 2: Menerima Respons

Respons cURL biasanya termasuk HTML halaman web, yang mengandungi data yang akan dikikis. Anda boleh mengakses HTML ini menggunakan:

  • curl_getinfo(): Mendapatkan semula maklumat tentang respons, termasuk kod status HTTP dan pengepala.
  • curl_exec( ): Mengembalikan kandungan respons body.

Langkah 3: Menghuraikan HTML

Setelah anda mempunyai HTML, anda perlu mengekstrak data yang dikehendaki. Ini boleh dicapai menggunakan ungkapan biasa atau penghurai HTML. Tawaran PHP:

  • preg_match_all(): Melakukan padanan ungkapan biasa dan mengembalikan tatasusunan elemen padanan.
  • DOMDocument: Membolehkan anda untuk memanipulasi dan menavigasi HTML dokumen.

Contoh PHP Langkah demi Langkah

Coretan kod berikut menunjukkan cara mengikis tajuk halaman web menggunakan PHP:

<?php

ini_set('display_errors', 1);
error_reporting(E_ALL);
$url = 'https://example.com';

$curl = curl_init($url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($curl);
curl_close($curl);

$matches = array();
preg_match('/<title>(.*?)<\/title>/', $html, $matches);
$title = $matches[1];

Atas ialah kandungan terperinci Cara Mengikis Halaman Web dengan PHP: Panduan Langkah demi Langkah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn