Rumah > Soal Jawab > teks badan
Saya ingin mengekstrak kandungan bekas separa berikut:
<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both"> <a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a> </section>
Selalunya saya guna XPath macam ni:
$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');
Masalahnya sekarang ialah laman web nampaknya menggunakan javascript untuk menjana kandungan ini. Juga, saya tidak melihat sebarang permintaan XHR, yang akan membantu.
Adakah terdapat peluang untuk mengekstrak data?
Untuk menjadikannya lebih jelas. Ini bukan laman web saya. Saya perlu merebutnya.
Ini adalah halaman penuh:
https://www.wowhead.com/today-in-wow
P粉0417587002023-09-11 13:02:05
Anda betul, tapak menggunakan JavaScript sisi pelanggan dan tidak menggunakan permintaan XHR tambahan untuk data di atas. Oleh itu, kami mungkin menjangkakan data berada dalam kod yang dimuatkan pada mulanya (HTML+JS). Mencari kod untuk sesuatu seperti event=643
(类似于您的 event=479
) mengesahkan cadangan kami dan menghasilkan subrentetan berformat JSON yang diperlukan (saya telah menambah lekukan):
{ "icon": "calendar_weekendmistsofpandariastart", "name": "Timewalking Dungeon Event", "side": "both", "url": "/event=643/timewalking-dungeon-event" },
Jadi, anda akan melihat bahawa data yang diekstrak mengandungi data yang diperlukan dan kami mungkin menggunakan pelbagai alat untuk mengikisnya.