Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara Mengekstrak Maklumat Halaman daripada URL Menggunakan PHP

Cara Mengekstrak Maklumat Halaman daripada URL Menggunakan PHP

DDD
DDDasal
2024-10-17 18:59:03822semak imbas

How to Extract Page Information from URLs Using PHP

Teknik Mengikis Web dalam PHP: Mengekstrak Maklumat Halaman daripada URL

Dalam PHP, anda boleh mengekstrak maklumat halaman tertentu dengan cekap, seperti tajuk , imej dan penerangan, daripada URL yang disediakan oleh pengguna. Berikut ialah kaedah untuk mencapai matlamat ini:

Menggunakan Perpustakaan Simple_html_dom:

Pertimbangkan untuk menggunakan perpustakaan simple_html_dom untuk memudahkan pelaksanaan.

<code class="php">require 'simple_html_dom.php';
$html = file_get_html($url);
$title = $html->find('title', 0);
$image = $html->find('img', 0);

echo $title->plaintext."\n";
echo $image->src;</code>

Tanpa Perpustakaan Luaran:

Walaupun menggunakan DOMDocument mungkin bukan pendekatan yang ideal, anda juga boleh mengelakkan perpustakaan luaran dengan ungkapan biasa. Walau bagaimanapun, pendekatan ini tidak disyorkan untuk HTML kerana kerumitannya.

<code class="php">$data = file_get_contents($url);
preg_match('/<title>([^<]+)<\/title>/i', $data, $matches);
$title = $matches[1];

preg_match('/<img[^>]*src=["\']([^\'"]+)["\'][^>]*>/i', $data, $matches);
$img = $matches[1];

echo $title."\n";
echo $img;</code>

Teknik ini menunjukkan cara mengekstrak tajuk halaman menggunakan ungkapan biasa, diikuti dengan mengekstrak imej pertama daripada halaman.

Atas ialah kandungan terperinci Cara Mengekstrak Maklumat Halaman daripada URL Menggunakan PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn