이 글에서는 주로 Python에서 웹 페이지 액세스 및 크롤링에 사용되는 명령에 대한 관련 정보를 소개합니다. 필요한 친구는
Python에서 웹 페이지 액세스 및 크롤링에 사용되는 일반적인 명령
간단한 크롤링 웹페이지:
import urllib.request url="http://google.cn/" response=urllib.request.urlopen(url) #返回文件对象 page=response.read()
URL을 로컬 파일로 직접 저장:
import urllib.request url="http://google.cn/" response=urllib.request.urlopen(url) #返回文件对象 page=response.read()
POST 방법:
import urllib.parse import urllib.request url="http://liuxin-blog.appspot.com/messageboard/add" values={"content":"命令行发出网页请求测试"} data=urllib.parse.urlencode(values) #创建请求对象 req=urllib.request.Request(url,data) #获得服务器返回的数据 response=urllib.request.urlopen(req) #处理数据 page=response.read()
GET 방법:
import urllib.parse import urllib.request url="http://www.google.cn/webhp" values={"rls":"ig"} data=urllib.parse.urlencode(values) theurl=url+"?"+data #创建请求对象 req=urllib.request.Request(theurl) #获得服务器返回的数据 response=urllib.request.urlopen(req) #处理数据 page=response.read()에는 일반적으로 사용되는 두 가지 방법인 geturl(), info()geturl( )는 서버 측 URL 리디렉션이 있는지 식별하도록 설정되어 있으며 info()에는 일련의 정보가 포함되어 있습니다. 중국어 문제를 처리하기 위해 encode() 인코딩과 dencode() 디코딩이 사용됩니다.
위 내용은 Python에서 웹 페이지에 액세스하고 크롤링하는 데 사용되는 일반적인 명령의 예에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!