如何使用Python 的Requests 庫偽造瀏覽器存取
當使用Python 的Requests 套件或wget 指令等工具以程式方式存取網站時,您與透過網頁瀏覽器造訪網站時相比,檢索到的HTML 內容可能會有所差異。這種差異源於這樣一個事實:網站通常採用機制來區分真正的瀏覽器存取和自動請求。
克服這項挑戰的一種有效方法是透過提供「User-Agent」標頭來模擬合法的瀏覽器存取在你的要求中。此標頭包含有關所使用的特定瀏覽器和版本的信息,這有助於網站將其識別為人類發起的訪問。
要使用 Python 的 Requests 函式庫實作此解決方案,請依照下列步驟操作:
範例程式碼:
作為參考,這裡提供了不同瀏覽器的用戶代理字串的完整列表:
[所有瀏覽器列表](https://deviceatlas.com/ blog/list-of-user-agent-strings)
或者,您可以使用fake-useragent 第三方包,這可以簡化流程產生真實的使用者代理字串。下面是它的用法示範:
以上是如何使用 Python 的 Requests 函式庫偽造瀏覽器存取?的詳細內容。更多資訊請關注PHP中文網其他相關文章!