首頁 >後端開發 >php教程 >使用 PHP 爬取 Steam 遊戲訊息

使用 PHP 爬取 Steam 遊戲訊息

王林
王林原創
2023-06-14 17:26:332084瀏覽

隨著遊戲產業的發展,越來越多的遊戲玩家透過 Steam 平台購買遊戲。作為全球最大的PC遊戲分銷平台,Steam提供了豐富的遊戲和社群功能,吸引了來自全球的大量遊戲愛好者。如果你是Steam遊戲愛好者,或是想要了解Steam遊戲資訊的開發者,那麼本文將介紹如何使用 PHP 語言爬取Steam遊戲資訊。

一、了解Steam API

Steam 提供了官方 API (Application Program Interface,應用程式介面),如果你是個開發者,可以使用官方 API 來取得遊戲資訊。但是,使用官方API需要先進行身份驗證,而且官方API 的限制較多。比如說,取得遊戲的價格、評分、推薦等資訊都需要用戶登入 Steam。因此,本文將介紹如何使用 PHP 爬取 Steam 遊戲資訊的網頁資料。

二、取得 Steam 遊戲頁面原始碼

在使用 PHP 爬取 Steam 遊戲資訊之前,我們需要先了解如何取得 Steam 遊戲頁面的原始碼。開啟任一款Steam遊戲詳情頁,在瀏覽器中開啟開發者工具,切換到“Network”選項卡,將請求類型設為“all”,重新整理頁面。你會看到所有的請求記錄,其中有一個名為「store.steampowered.com」的請求記錄,這是我們需要的請求。

將遊標移至該請求下方,在右側的“Headers”選項卡下找到“Request URL”,這個URL 就是該遊戲詳情頁的完整地址,將該地址複製下來,在PHP 代碼中使用file_get_contents() 函數取得該頁面原始碼。

三、解析 Steam 遊戲頁面原始碼

爬取 Steam 遊戲資訊的下一步是解析 Steam 遊戲頁面原始碼。我們可以使用 PHP 中的 DOMDocument 和 DOMXPath 類別來解析 HTML 文件。首先,我們需要將下載的頁面原始碼傳遞給 DOMDocument 類別的 loadHTML() 方法來建立一個 DOM 對象,然後透過 DOMXPath 類別的 query() 方法來查詢元素。

下面是一個範例程式碼,可以解析出 Steam 遊戲的名稱和發布日期:

$url = "https://store.steampowered.com/app/105600/";
$html = file_get_contents($url);

$doc = new DOMDocument();
$doc->loadHTML($html);

$xpath = new DOMXPath($doc);

$name = $xpath->query('//div[@class="apphub_AppName"]')->item(0)->nodeValue;
$date = $xpath->query('//div[@class="date"]')->item(0)->nodeValue;

echo "游戏名字:".$name."
";
echo "发布日期:".$date."
";

上面的程式碼中,我們使用了 XPath 查詢語言來查詢 Steam 遊戲頁面中的元素。其中,「//@class=」 參數指向了需要查詢的類別名, item() 方法用於取得第一個符合的元素, nodeValue 屬性用於取得元素的文字內容。

四、爬取 Steam 遊戲的更多資訊

有了前幾步的基礎,現在你可以使用相同的方法來獲取 Steam 遊戲的其他資訊。以下是一些常見的Steam 遊戲資訊的查詢Xpath:

  1. #遊戲價格:
$price = $xpath->query('//div[@class="game_purchase_price"]')->item(0)->nodeValue;
  1. 遊戲評分:
$score = $xpath->query('//div[@class="user_reviews_summary_row"]')->item(0)->getAttribute("data-tooltip-text");
  1. 遊戲開發人員和發行商:
$developer = $xpath->query('//div[@id="developers_list"]//a')->item(0)->nodeValue;
$publisher = $xpath->query('//div[@id="publishers_list"]//a')->item(0)->nodeValue;
  1. 遊戲推薦配置:
$config = $xpath->query('//div[@class="sysreq_contents"]')->item(0)->nodeValue;

在實際使用中,你可以根據需求自訂需要查詢的元素。但需要注意,Steam 網站的 HTML 結構可能會改變,所以請檢查你的程式碼是否正常運行,如果網頁結構發生變化,你需要更新你的查詢方法。

五、提交 Steam 遊戲資訊

完成了對 Steam 遊戲資訊的爬取,我們可以將這些資訊提交到你的資料庫或其他的資料儲存中。在實務中,你可能會遇到一些反爬蟲的機制,例如限制 IP 位址、驗證碼等,所以在編寫 PHP 程式碼時請注意遵守 Steam 對爬蟲的條款,並合理使用資料抓取方法。

結語

本文介紹如何使用 PHP 語言爬取 Steam 遊戲資訊的基本方法。透過使用 DOMDocument 和 DOMXPath 等技術,我們可以從 Steam 遊戲頁面中提取有用的信息,如遊戲名稱、發行商、價格、評分和建議配置等。希望這篇文章可以對爬蟲愛好者、Steam 遊戲開發者和Steam 玩家提供協助。

以上是使用 PHP 爬取 Steam 遊戲訊息的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn