Rumah  >  Soal Jawab  >  teks badan

Ekstrak kandungan yang dihasilkan javascript untuk halaman tertentu

Saya ingin mengekstrak kandungan bekas separa berikut:

<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both">
<a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a>
</section>

Selalunya saya guna XPath macam ni:

$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');

Masalahnya sekarang ialah laman web nampaknya menggunakan javascript untuk menjana kandungan ini. Juga, saya tidak melihat sebarang permintaan XHR, yang akan membantu.

Adakah terdapat peluang untuk mengekstrak data?

Untuk menjadikannya lebih jelas. Ini bukan laman web saya. Saya perlu merebutnya.

Ini adalah halaman penuh:

https://www.wowhead.com/today-in-wow

P粉536909186P粉536909186428 hari yang lalu475

membalas semua(1)saya akan balas

  • P粉041758700

    P粉0417587002023-09-11 13:02:05

    Anda betul, tapak menggunakan JavaScript sisi pelanggan dan tidak menggunakan permintaan XHR tambahan untuk data di atas. Oleh itu, kami mungkin menjangkakan data berada dalam kod yang dimuatkan pada mulanya (HTML+JS). Mencari kod untuk sesuatu seperti event=643(类似于您的 event=479) mengesahkan cadangan kami dan menghasilkan subrentetan berformat JSON yang diperlukan (saya telah menambah lekukan):

    {
       "icon": "calendar_weekendmistsofpandariastart",
       "name": "Timewalking Dungeon Event",
       "side": "both",
       "url": "/event=643/timewalking-dungeon-event"
    },

    Jadi, anda akan melihat bahawa data yang diekstrak mengandungi data yang diperlukan dan kami mungkin menggunakan pelbagai alat untuk mengikisnya.

    balas
    0
  • Batalbalas