Rumah > Artikel > pembangunan bahagian belakang > Ungkapan biasa PHP: cara memadankan semua teg jadual dalam HTML
Dalam PHP, ungkapan biasa ialah alat yang sangat berguna yang boleh digunakan untuk memproses pelbagai teks dan rentetan. Ekspresi biasa juga merupakan salah satu kaedah yang sangat mudah untuk memproses fail HTML. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa PHP untuk memadankan semua teg jadual dalam HTML, yang sangat praktikal dalam masalah yang sama.
Pertama sekali, anda perlu tahu rupa teg jadual dalam HTML. Teg jadual biasanya digunakan untuk menentukan jadual, yang mengandungi teg tr (baris) dan td (sel). Contoh jadual HTML ringkas adalah seperti berikut:
<table> <tr> <td>单元格1</td> <td>单元格2</td> </tr> <tr> <td>单元格3</td> <td>单元格4</td> </tr> </table>
Dalam contoh di atas, teg f5d188ed2c074f8b944552db028f98a1
mengandungi dua teg a34de1251f0d9fe1e645927f19a896e8
dan setiap teg a34de1251f0d9fe1e645927f19a896e8
mengandungi dua teg b6c5a531a458a2e790c1fd6421739d1c
. Dalam aplikasi sebenar, jadual HTML mungkin mengandungi pelbagai elemen, seperti pengepala dan pengaki jadual, sel bercantum, gaya, dsb., tetapi ini tidak menjejaskan kaedah pemadanan kami.
Seterusnya, kami menggunakan ungkapan biasa dalam PHP untuk memadankan semua teg jadual. Berikut ialah pelaksanaan kod mudah:
$regex = '/<table.*?>.*?</table>/s'; preg_match_all($regex, $html, $matches);
Kod di atas menggunakan fungsi preg_match_all
untuk mencari semua teg jadual yang sepadan dalam HTML. Antaranya, $regex
mewakili ungkapan biasa, yang menggunakan .*?
untuk memadankan mana-mana aksara, supaya ungkapan biasa ini boleh memadankan teg jadual pada sebarang panjang. Dalam ungkapan ini, pilihan s
juga digunakan untuk menunjukkan bahawa "."
Jika kita mentakrifkan pembolehubah $html dalam PHP yang mengandungi dokumen HTML lengkap, maka pembolehubah $matches akan mengandungi semua teg jadual yang sepadan dengan ungkapan biasa. Struktur tatasusunan yang dikembalikan oleh $matches adalah seperti berikut:
Array ( [0] => Array ( [0] => <table><tr><td>单元格1</td><td>单元格2</td></tr><tr><td>单元格3</td><td>单元格4</td></tr></table> ) )
Dalam tatasusunan di atas, $matches[0] ialah semua rentetan yang dipadankan. Dalam aplikasi praktikal, kami boleh menggunakan lagi $matches[0]
untuk beroperasi pada setiap teg jadual, seperti mengekstrak data, mengubah suai gaya, dsb.
Ringkasnya, adalah sangat mudah untuk menggunakan ungkapan biasa PHP untuk memadankan semua teg jadual dalam HTML Anda hanya perlu menentukan ungkapan biasa yang sesuai dan kemudian menggunakan fungsi preg_match_all
untuk mencapainya. Walaupun ungkapan biasa mungkin tidak secekap kaedah lain apabila memproses sejumlah besar data, ungkapan biasa masih merupakan salah satu alat paling praktikal dalam pemprosesan data berskala kecil.
Atas ialah kandungan terperinci Ungkapan biasa PHP: cara memadankan semua teg jadual dalam HTML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!