Heim >Backend-Entwicklung >PHP-Tutorial >Verwenden Sie PHP, um Steam-Spielinformationen zu crawlen
Mit der Entwicklung der Spielebranche kaufen immer mehr Spieler Spiele über die Steam-Plattform. Als weltweit größte Vertriebsplattform für PC-Spiele bietet Steam eine Fülle von Spiel- und Community-Funktionen und zieht eine große Anzahl von Spielebegeisterten aus der ganzen Welt an. Wenn Sie ein Steam-Spiele-Enthusiast oder Entwickler sind und Informationen zu Steam-Spielen erhalten möchten, erfahren Sie in diesem Artikel, wie Sie mithilfe der PHP-Sprache Informationen zu Steam-Spielen crawlen.
1. Verstehen Sie die Steam-API
Steam stellt eine offizielle API (Application Program Interface, Anwendungsprogrammierschnittstelle) zur Verfügung. Wenn Sie Entwickler sind, können Sie die offizielle API verwenden, um Spielinformationen zu erhalten. Die Verwendung der offiziellen API erfordert jedoch zunächst eine Authentifizierung und die offizielle API weist viele Einschränkungen auf. Um beispielsweise Spielepreise, Bewertungen, Empfehlungen und andere Informationen zu erhalten, müssen sich Benutzer bei Steam anmelden. Daher wird in diesem Artikel erläutert, wie Sie mit PHP Webdaten von Steam-Spielinformationen crawlen.
2. Erhalten Sie den Quellcode der Steam-Spieleseite
Bevor wir PHP zum Crawlen von Steam-Spielinformationen verwenden, müssen wir zunächst verstehen, wie wir den Quellcode der Steam-Spieleseite erhalten. Öffnen Sie eine beliebige Steam-Spieldetailseite, öffnen Sie die Entwicklertools im Browser, wechseln Sie zur Registerkarte „Netzwerk“, stellen Sie den Anforderungstyp auf „Alle“ ein und aktualisieren Sie die Seite. Sie sehen alle Anfragedatensätze, und es gibt einen mit dem Namen „store.steampowered.com“, der Anfrage, die wir benötigen.
Bewegen Sie den Cursor unter die Anfrage und suchen Sie die „Anfrage-URL“ unter der Registerkarte „Kopfzeilen“ auf der rechten Seite. Diese URL ist die vollständige Adresse der Spieldetailseite und verwenden Sie Die Funktion file_get_contents()
ruft den Quellcode der Seite ab. file_get_contents()
函数获取该页面源代码。
三、解析 Steam 游戏页面源代码
爬取 Steam 游戏信息的下一步是解析 Steam 游戏页面源代码。我们可以使用 PHP 中的 DOMDocument 和 DOMXPath 类来解析 HTML 文档。 首先,我们需要将下载的页面源代码传递给 DOMDocument 类的 loadHTML()
方法来创建一个 DOM 对象,然后通过 DOMXPath 类的 query()
方法来查询元素。
下面是一个示例代码,可以解析出 Steam 游戏的名字和发布日期:
$url = "https://store.steampowered.com/app/105600/"; $html = file_get_contents($url); $doc = new DOMDocument(); $doc->loadHTML($html); $xpath = new DOMXPath($doc); $name = $xpath->query('//div[@class="apphub_AppName"]')->item(0)->nodeValue; $date = $xpath->query('//div[@class="date"]')->item(0)->nodeValue; echo "游戏名字:".$name." "; echo "发布日期:".$date." ";
上面的代码中,我们使用了 XPath 查询语言来查询 Steam 游戏页面中的元素。其中,“//@class=” 参数指向了需要查询的类名, item()
方法用于获取第一个匹配的元素, nodeValue
loadHTML()
der DOMDocument-Klasse übergeben, um ein DOM-Objekt zu erstellen, und es dann über query()
abfragen Methode des DOMXPath-Klassenelements. Das Folgende ist ein Beispielcode, der den Namen und das Veröffentlichungsdatum eines Steam-Spiels analysieren kann: $price = $xpath->query('//div[@class="game_purchase_price"]')->item(0)->nodeValue;
item()
wird verwendet, um das erste passende Element zu erhalten, und der Parameter nodeValue Das Attribut code> wird verwendet, um den Textinhalt des Elements abzurufen.
Das obige ist der detaillierte Inhalt vonVerwenden Sie PHP, um Steam-Spielinformationen zu crawlen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!