Heim >Backend-Entwicklung >Python-Tutorial >Wie erhält der Python-Crawler Cookies?

Wie erhält der Python-Crawler Cookies?

尚
Original
2019-07-02 16:05:137434Durchsuche

Wie erhält der Python-Crawler Cookies?

Cookie bezieht sich auf die Daten (normalerweise verschlüsselt), die von einigen Websites auf dem lokalen Terminal des Benutzers gespeichert werden, um die Identität des Benutzers zu identifizieren und eine Sitzungsverfolgung durchzuführen. Bei einigen Websites ist beispielsweise eine Anmeldung erforderlich, bevor Sie auf eine bestimmte Seite zugreifen können. Vor dem Anmelden ist es unterschiedlich oder nicht zulässig, den Inhalt einer bestimmten Seite zu crawlen.

In Python stellt es uns das Cookiejar-Modul zur Verfügung, das sich zur Cookie-Unterstützung im http-Paket befindet. Dadurch können wir das Cookie erfassen und es bei nachfolgenden Verbindungsanfragen erneut senden, beispielsweise können wir die simulierte Anmeldefunktion implementieren. Die Hauptobjekte dieses Moduls sind CookieJar, FileCookieJar, MozillaCookieJar und LWPCookieJar.

So erhalten Sie Cookies

## cookie的获取

# -*- coding: UTF-8 -*-
from urllib import request
from http import cookiejar
if __name__ == '__main__':
    #声明一个CookieJar对象实例来保存cookie
    cookie = cookiejar.CookieJar()
    #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler
    handler=request.HTTPCookieProcessor(cookie)
    #通过CookieHandler创建opener
    opener = request.build_opener(handler)
    #此处的open方法打开网页
    response = opener.open('http://www.baidu.com')
    #打印cookie信息
    for item in cookie:
        print('Name = %s' % item.name)
        print('Value = %s' % item.value)

Weitere technische Artikel zum Thema Python finden Sie in der Spalte Python-Tutorial, um mehr darüber zu erfahren!

Das obige ist der detaillierte Inhalt vonWie erhält der Python-Crawler Cookies?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn