Heim  >  Artikel  >  Backend-Entwicklung  >  Wie passt man den Benutzeragenten in Pythons urllib2.urlopen an?

Wie passt man den Benutzeragenten in Pythons urllib2.urlopen an?

Patricia Arquette
Patricia ArquetteOriginal
2024-10-28 08:31:02495Durchsuche

How to Customize the User Agent in Python's urllib2.urlopen?

Anpassen des Benutzeragenten mit urllib2.urlopen

Heruntergeladene Webseiten zeigen häufig die Standardzeichenfolge des Benutzeragenten an. Es gibt jedoch Situationen, in denen die Änderung dieser Zeichenfolge von entscheidender Bedeutung ist. Die Frage deckt diesen Bedarf auf und sucht nach einer Lösung, um den Benutzeragenten während des Webseiten-Downloads zu ändern.

In Python 2.x dient urllib2.urlopen als Tool zum Öffnen einer Website und zum Abrufen ihres Inhalts. Die Antwort kann genutzt werden, um auf den Quellcode der Webseite zuzugreifen oder Verbindungen herzustellen. Allerdings ist die Anpassung des Benutzeragenten für urllib2.urlopen nicht sofort ersichtlich.

Die Lösung besteht darin, manuell einen Opener zu erstellen und den gewünschten Benutzeragenten im Header anzugeben. Dieser modifizierte Öffner kann dann zum Öffnen der Webseite verwendet werden, wie unten dargestellt:

<code class="python">opener = urllib2.build_opener()
opener.addheaders = [('User-Agent', 'Mozilla/5.0')]
response = opener.open('http://www.stackoverflow.com')</code>

Beachten Sie, dass die Benutzeragentenzeichenfolge gemäß RFC 2616 Abschnitt 14.43 großgeschrieben wird. Diese Änderung stellt sicher, dass die Webseite mit dem angegebenen Benutzeragenten heruntergeladen wird, was möglicherweise das wahrgenommene Verhalten des anfordernden Clients verändert.

Das obige ist der detaillierte Inhalt vonWie passt man den Benutzeragenten in Pythons urllib2.urlopen an?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn