Maison > Questions et réponses > le corps du texte
Je souhaite extraire le contenu des conteneurs partiels suivants :
<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both"> <a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a> </section>
Habituellement, j'utilise XPath comme ceci :
$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');
Le problème maintenant est que le site Web semble utiliser javascript pour générer ce contenu. De plus, je ne vois aucune demande XHR, ce qui pourrait aider.
Y a-t-il une possibilité d'extraire les données ?
Pour que ce soit plus clair. Ceci n'est pas mon site Web. Je dois l'attraper.
Voici la page complète :
https://www.wowhead.com/today-in-wow
P粉0417587002023-09-11 13:02:05
Vous avez raison, le site utilise JavaScript côté client et n'utilise pas de requêtes XHR supplémentaires pour les données ci-dessus. Par conséquent, nous pourrions nous attendre à ce que les données se trouvent dans le code initialement chargé (HTML+JS). La recherche dans le code de quelque chose comme event=643
(类似于您的 event=479
) confirme notre suggestion et produit la sous-chaîne requise au format JSON (j'ai ajouté l'indentation) :
{ "icon": "calendar_weekendmistsofpandariastart", "name": "Timewalking Dungeon Event", "side": "both", "url": "/event=643/timewalking-dungeon-event" },
Vous verrez ainsi que les données extraites contiennent les données requises, nous pouvons utiliser divers outils pour les récupérer.