ホームページ >バックエンド開発 >Python チュートリアル >Python の urllib2.urlopen でユーザー エージェントをカスタマイズするにはどうすればよいですか?

Python の urllib2.urlopen でユーザー エージェントをカスタマイズするにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-28 08:31:02653ブラウズ

How to Customize the User Agent in Python's urllib2.urlopen?

urllib2.urlopen を使用したユーザー エージェントのカスタマイズ

ダウンロードされた Web ページには、多くの場合、デフォルトのユーザー エージェント文字列が表示されます。ただし、この文字列の変更が重要となるシナリオもあります。この質問はこのニーズを明らかにし、Web ページのダウンロード中にユーザー エージェントを変更する解決策を模索しています。

Python 2.x では、urllib2.urlopen は Web サイトを開いてそのコンテンツを取得するツールとして機能します。応答を利用して、Web ページのソース コードにアクセスしたり、接続を確立したりできます。ただし、urllib2.urlopen のユーザー エージェントのカスタマイズは、すぐにはわかりません。

解決策には、オープナーを手動で構築し、ヘッダーで目的のユーザー エージェントを指定することが含まれます。次に、以下に示すように、この変更されたオープナーを使用して Web ページを開くことができます。

<code class="python">opener = urllib2.build_opener()
opener.addheaders = [('User-Agent', 'Mozilla/5.0')]
response = opener.open('http://www.stackoverflow.com')</code>

ユーザー エージェント文字列は、RFC 2616 セクション 14.43 に従って大文字であることに注意してください。この変更により、指定されたユーザー エージェントを使用して Web ページがダウンロードされるようになり、要求側クライアントの認識される動作が変更される可能性があります。

以上がPython の urllib2.urlopen でユーザー エージェントをカスタマイズするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。