使用 urllib2.urlopen 自訂使用者代理
下載的網頁通常會顯示預設的使用者代理字串。但是,在某些情況下修改此字串至關重要。該問題暴露了這種需求,並尋求一種在網頁下載期間更改用戶代理的解決方案。
在 Python 2.x 中,urllib2.urlopen 用作開啟網站並檢索其內容的工具。可以利用回應來存取網頁的原始碼或建立連線。然而,為 urllib2.urlopen 客製化使用者代理程式並不是立即顯而易見的。
解決方案涉及手動建構一個開啟器並在標頭中指定所需的用戶代理。然後可以使用此修改後的開啟程式開啟網頁,如下所示:
<code class="python">opener = urllib2.build_opener() opener.addheaders = [('User-Agent', 'Mozilla/5.0')] response = opener.open('http://www.stackoverflow.com')</code>
請注意,根據 RFC 2616 第 14.43 節,使用者代理字串是大寫的。此修改可確保使用指定的使用者代理下載網頁,從而可能改變請求客戶端的感知行為。
以上是如何在Python的urllib2.urlopen中自訂用戶代理程式?的詳細內容。更多資訊請關注PHP中文網其他相關文章!