>  기사  >  백엔드 개발  >  Python의 요청과 사용자 에이전트를 사용하여 웹사이트 차단을 극복하는 방법은 무엇입니까?

Python의 요청과 사용자 에이전트를 사용하여 웹사이트 차단을 극복하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-11-15 08:48:02754검색

How to Overcome Website Blocks Using Python's Requests and User Agents?

Python의 요청 및 사용자 에이전트를 사용하여 브라우저 방문 위장: 웹 사이트 차단에 대한 솔루션

Python의 요청 패키지를 사용하여 웹 사이트에 액세스할 때 다음과 같은 문제가 발생할 수 있습니다. 얻은 HTML 콘텐츠가 브라우저에 표시된 콘텐츠와 크게 다른 경우. 이는 브라우저가 아닌 사용자에 대한 액세스를 식별하고 제한하는 블록을 사용하는 웹사이트로 인해 발생하는 경우가 많습니다.

이를 극복하려면 브라우저 유형과 운영 체제를 식별하는 User-Agent 헤더를 제공하여 브라우저 방문을 시뮬레이션할 수 있습니다. 시스템을 사용하고 있습니다. 이를 통해 웹사이트는 이것이 진정한 브라우저 방문이라고 믿게 되어 원하는 콘텐츠에 대한 액세스 권한을 부여하게 됩니다. 요청으로 수행할 수 있는 방법은 다음과 같습니다.

import requests

url = 'http://www.ichangtou.com/#company:data_000008.html'
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}

response = requests.get(url, headers=headers)
print(response.content)

또는 fake-useragent 패키지는 다양한 브라우저에 대한 사용자 에이전트를 생성하고 사용하는 편리한 방법을 제공합니다.

from fake_useragent import UserAgent
ua = UserAgent()
random_ua = ua.random
headers = {'User-Agent': random_ua}
response = requests.get(url, headers=headers)

활용하여 브라우저 방문을 위조하는 이러한 기술을 사용하면 이전에 Python 기반 시도를 차단했던 웹사이트에 성공적으로 액세스할 수 있습니다.

위 내용은 Python의 요청과 사용자 에이전트를 사용하여 웹사이트 차단을 극복하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.