suchen

Heim  >  Fragen und Antworten  >  Hauptteil

Extrahieren Sie mit Javascript generierte Inhalte für eine bestimmte Seite

Ich möchte den Inhalt der folgenden Teilbehälter extrahieren:

<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both">
<a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a>
</section>

Normalerweise verwende ich XPath so:

$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');

Das Problem besteht nun darin, dass die Website offenbar Javascript verwendet, um diesen Inhalt zu generieren. Außerdem sehe ich keine XHR-Anfragen, die helfen würden.

Gibt es eine Möglichkeit, die Daten zu extrahieren?

Um es klarer zu machen. Dies ist nicht meine Website. Ich muss es packen.

Dies ist die ganze Seite:

https://www.wowhead.com/today-in-wow

P粉536909186P粉536909186430 Tage vor477

Antworte allen(1)Ich werde antworten

  • P粉041758700

    P粉0417587002023-09-11 13:02:05

    您是对的,该网站使用客户端 JavaScript,并且不会对上述数据使用额外的 XHR 请求。因此,我们可能期望数据位于最初加载的代码(HTML+JS)内。在代码中搜索类似 event=643(类似于您的 event=479)的内容可以确认我们的建议,并生成所需的 JSON 格式的子字符串(我已添加缩进) ):

    {
       "icon": "calendar_weekendmistsofpandariastart",
       "name": "Timewalking Dungeon Event",
       "side": "both",
       "url": "/event=643/timewalking-dungeon-event"
    },

    所以你会看到提取的数据包含所需的数据,我们可能会使用各种工具来抓取它。

    Antwort
    0
  • StornierenAntwort