ホームページ  >  記事  >  バックエンド開発  >  Python クローラーはどのようにして Cookie を取得するのでしょうか

Python クローラーはどのようにして Cookie を取得するのでしょうか

尚
オリジナル
2019-07-02 16:05:137369ブラウズ

Python クローラーはどのようにして Cookie を取得するのでしょうか

Cookie は、ユーザーの身元を特定し、セッション追跡を実行するために、一部の Web サイトによってユーザーのローカル端末に保存されるデータ (通常は暗号化された) を指します。たとえば、Web サイトによっては、特定のページにアクセスする前にログインが必要な場合があります。ログインする前に、特定のページのコンテンツをキャプチャしたい場合があります。ログイン前とログイン後のコンテンツが異なっていたり、許可されていない場合があります。 。

Python では、cookiejar モジュールが提供されます。これは http パッケージにあり、Cookie をサポートするために使用されます。これにより、Cookie をキャプチャし、後続の接続リクエストで再送信できます。たとえば、シミュレートされたログイン機能を実装できます。このモジュールの主なオブジェクトは、CookieJar、FileCookieJar、MozillaCookieJar、および LWPCookieJar です。

Cookie の取得方法

## cookie的获取

# -*- coding: UTF-8 -*-
from urllib import request
from http import cookiejar
if __name__ == '__main__':
    #声明一个CookieJar对象实例来保存cookie
    cookie = cookiejar.CookieJar()
    #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler
    handler=request.HTTPCookieProcessor(cookie)
    #通过CookieHandler创建opener
    opener = request.build_opener(handler)
    #此处的open方法打开网页
    response = opener.open('http://www.baidu.com')
    #打印cookie信息
    for item in cookie:
        print('Name = %s' % item.name)
        print('Value = %s' % item.value)

Python 関連の技術記事をさらに詳しく知りたい場合は、Python チュートリアル 列にアクセスして学習してください。

以上がPython クローラーはどのようにして Cookie を取得するのでしょうかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。