Rumah > Artikel > pembangunan bahagian belakang > Bagaimana untuk membuang tag html dalam php (tiga kaedah)
Dengan perkembangan berterusan teknologi Internet, pembangunan laman web telah menjadi semakin kompleks dan diperkaya. Dalam penyelenggaraan dan pembangunan laman web, kod HTML sering digunakan. Walaupun HTML adalah asas halaman web, kadangkala kita perlu mengekstrak teks biasa daripada HTML, jadi kita perlu mengalih keluar tag HTML. Sebagai tindak balas kepada permintaan ini, artikel ini akan memperkenalkan cara menggunakan PHP untuk mengalih keluar HTML.
1. Gunakan fungsi strip_tags untuk mengalih keluar HTML
Dalam PHP, fungsi strip_tags digunakan khas untuk mengalih keluar tag HTML. Penggunaan fungsi ini adalah seperti berikut:
strip_tags($str, $allowTags)
di mana $str ialah rentetan yang akan diproses, $allowTags ialah parameter pilihan, yang merujuk kepada teg HTML yang dibenarkan untuk dikekalkan ditentukan, semua teg HTML dialih keluar. Berikut ialah contoh kod:
$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>'; echo strip_tags($html);
Hasil output ialah:
这是一段带有HTML标签的文本,这是链接。
Kod ini akan mengalih keluar teg HTML dan hanya menyimpan teks.
2. Gunakan ungkapan biasa untuk mengalih keluar HTML
Selain menggunakan fungsi strip_tags, anda juga boleh menggunakan ungkapan biasa untuk mengalih keluar teg HTML. Perlu diingatkan bahawa sebelum menggunakan ungkapan biasa, anda perlu memahami sintaks asas tag HTML.
Teg HTML dibalut dengan kurungan sudut dan mempunyai teg permulaan dan teg penamat. Teg pembuka bermula dengan "<" dan berakhir dengan ">"; Nama tag terdiri daripada huruf, nombor dan garis bawah.
Berikut ialah kod contoh ungkapan biasa mudah yang boleh digunakan untuk mengalih keluar tag HTML:
$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>'; echo preg_replace('/<[^>]+>/u', '', $html);
Outputnya ialah:
这是一段带有HTML标签的文本,这是链接。
Kod ini akan sepadan Semua aksara antara "<" dan ">" dan gantikannya dengan rentetan kosong.
3. Gunakan kelas DOMDocument untuk mengalih keluar HTML
Selain daripada dua kaedah di atas, anda juga boleh menggunakan kelas DOMDocument PHP untuk mengalih keluar teg HTML. Kelebihan kaedah ini ialah ia boleh mengelakkan ralat penghuraian yang disebabkan oleh kod HTML yang tidak teratur. Kod sampel adalah seperti berikut:
$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>'; $dom = new DOMDocument(); // 创建一个DOMDocument对象 $dom->loadHTML($html); // 将HTML字符串加载到对象中 echo $dom->textContent; // 输出内容
Hasil output ialah:
这是一段带有HTML标签的文本,这是链接。
Kelas DOMDocument menghuraikan kod HTML ke dalam pepohon DOM, dan kemudian anda boleh menggunakan kaedah yang disediakan oleh kelas ini untuk memanipulasi Elemen pokok DOM, seperti mendapatkan nama teg dan atribut elemen.
Ringkasan
Teg HTML boleh dialih keluar dengan mudah melalui tiga kaedah di atas, tetapi anda perlu memilih kaedah mana yang lebih sesuai untuk senario semasa berdasarkan keperluan sebenar. Jika kod HTML secara relatifnya diseragamkan, adalah disyorkan untuk menggunakan fungsi strip_tags atau kaedah ungkapan biasa kerana ia lebih pantas jika lebih fleksibiliti diperlukan, adalah disyorkan untuk menggunakan kelas DOMDocument untuk menghuraikan kod HTML.
Atas ialah kandungan terperinci Bagaimana untuk membuang tag html dalam php (tiga kaedah). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!