Rumah > Artikel > pembangunan bahagian belakang > Bagaimanakah cara saya mengekstrak teks khusus daripada HTML menggunakan DOMDocument dan XPath PHP?
Menghuraikan HTML dengan DOMDocument PHP
Untuk mengekstrak elemen teks tertentu daripada HTML menggunakan DOMDocument PHP, memanfaatkan pertanyaan XPath boleh menjadi lebih berkesan daripada bergantung semata-mata pada DOMDocument::getElementsByTagName. Pertanyaan XPath membenarkan pemilihan tepat berdasarkan kriteria khusus dalam struktur dokumen.
Menangkap Teks daripada DIV Bersarang
Contoh HTML yang disediakan mengandungi
Untuk menangkap teks sasaran, pertanyaan XPath boleh digunakan:
<code class="php">$xpath->query('//div[@class="main"]/div[@class="text"]');</code>
Pertanyaan ini memilih semua
Mengulang dan Mengekstrak Nilai Nod
Untuk mengakses kandungan teks sebenar, setiap elemen padanan boleh diulang dan nodeValuenya sifat diakses:
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
Fungsi trim() digunakan untuk mengalih keluar sebarang ruang putih di hadapan atau di belakang daripada teks yang diekstrak.
Output Pelaksanaan
Melaksanakan kod akan mengeluarkan yang berikut:
string 'Capture this text 1' (length=19) string 'Capture this text 2' (length=19)
Atas ialah kandungan terperinci Bagaimanakah cara saya mengekstrak teks khusus daripada HTML menggunakan DOMDocument dan XPath PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!