如何使用 Python 的请求模拟浏览器访问:伪造用户代理指南
尝试使用 Python 的请求检索 Web 内容或wget,与使用标准浏览器相比,您可能会遇到意想不到的结果。这是因为网站通常会实施保护措施来防止自动查询。为了克服这一挑战,您可以通过提供 User-Agent 标头来伪造浏览器访问。
实现 User-Agent 标头
要伪造浏览器访问,您需要在您的请求中包含 User-Agent 标头。此标头指定所使用的浏览器和设备的类型,使您的请求看起来更像合法用户。以下是使用 Python 请求的示例:
import requests # Define the target website URL url = 'http://www.ichangtou.com/#company:data_000008.html' # Create a dictionary of headers with a valid User-Agent string headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'} # Send the request with the User-Agent header response = requests.get(url, headers=headers) # Print the response content print(response.content)
其他资源
以上是如何使用 Python 的请求模拟浏览器访问:如何使我的 Python 请求看起来像是来自真实的浏览器?的详细内容。更多信息请关注PHP中文网其他相关文章!