recherche

Maison  >  Questions et réponses  >  le corps du texte

Extraire le contenu généré par javascript pour une page spécifique

Je souhaite extraire le contenu des conteneurs partiels suivants :

<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both">
<a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a>
</section>

Habituellement, j'utilise XPath comme ceci :

$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');

Le problème maintenant est que le site Web semble utiliser javascript pour générer ce contenu. De plus, je ne vois aucune demande XHR, ce qui pourrait aider.

Y a-t-il une possibilité d'extraire les données ?

Pour que ce soit plus clair. Ceci n'est pas mon site Web. Je dois l'attraper.

Voici la page complète :

https://www.wowhead.com/today-in-wow

P粉536909186P粉536909186430 Il y a quelques jours476

répondre à tous(1)je répondrai

  • P粉041758700

    P粉0417587002023-09-11 13:02:05

    Vous avez raison, le site utilise JavaScript côté client et n'utilise pas de requêtes XHR supplémentaires pour les données ci-dessus. Par conséquent, nous pourrions nous attendre à ce que les données se trouvent dans le code initialement chargé (HTML+JS). La recherche dans le code de quelque chose comme event=643(类似于您的 event=479) confirme notre suggestion et produit la sous-chaîne requise au format JSON (j'ai ajouté l'indentation) :

    {
       "icon": "calendar_weekendmistsofpandariastart",
       "name": "Timewalking Dungeon Event",
       "side": "both",
       "url": "/event=643/timewalking-dungeon-event"
    },

    Vous verrez ainsi que les données extraites contiennent les données requises, nous pouvons utiliser divers outils pour les récupérer.

    répondre
    0
  • Annulerrépondre