>백엔드 개발 >파이썬 튜토리얼 >Python 크롤러는 어떻게 쿠키를 얻나요?

Python 크롤러는 어떻게 쿠키를 얻나요?

尚
원래의
2019-07-02 16:05:137401검색

Python 크롤러는 어떻게 쿠키를 얻나요?

쿠키는 일부 웹사이트에서 사용자의 신원을 식별하고 세션 추적을 수행하기 위해 사용자의 로컬 단말기에 저장하는 데이터(일반적으로 암호화됨)를 말합니다. 예를 들어, 일부 웹 사이트에서는 특정 페이지에 액세스하기 전에 로그인이 필요합니다. 로그인하기 전에 특정 페이지의 콘텐츠를 크롤링하려는 경우 로그인 후와 다르거나 허용되지 않습니다.

파이썬에서는 쿠키 지원을 위해 http 패키지에 있는 cookiejar 모듈을 제공합니다. 이를 통해 쿠키를 캡처하고 후속 연결 요청 시 이를 다시 보낼 수 있습니다. 예를 들어 시뮬레이션된 로그인 기능을 구현할 수 있습니다. 이 모듈의 주요 개체는 CookieJar, FileCookieJar, MozillaCookieJar 및 LWPCookieJar입니다.

쿠키를 얻는 방법

## cookie的获取

# -*- coding: UTF-8 -*-
from urllib import request
from http import cookiejar
if __name__ == '__main__':
    #声明一个CookieJar对象实例来保存cookie
    cookie = cookiejar.CookieJar()
    #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler
    handler=request.HTTPCookieProcessor(cookie)
    #通过CookieHandler创建opener
    opener = request.build_opener(handler)
    #此处的open方法打开网页
    response = opener.open('http://www.baidu.com')
    #打印cookie信息
    for item in cookie:
        print('Name = %s' % item.name)
        print('Value = %s' % item.value)

더 많은 Python 관련 기술 기사를 보려면 Python Tutorial 칼럼을 방문하여 알아보세요!

위 내용은 Python 크롤러는 어떻게 쿠키를 얻나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.