Maison  >  Article  >  développement back-end  >  Comment définir les en-têtes de requête pour le robot d'exploration Python

Comment définir les en-têtes de requête pour le robot d'exploration Python

爱喝马黛茶的安东尼
爱喝马黛茶的安东尼original
2019-06-20 14:30:382830parcourir

Lors de la demande d'exploration du Web, des mots tels que « Désolé, accès impossible » apparaîtront dans les informations textuelles de sortie. Cela signifie que l'exploration est interdite et que le mécanisme anti-exploration doit être utilisé pour résoudre ce problème.

Les en-têtes sont l'un des moyens de résoudre le problème de l'anti-exploration des requêtes. Cela équivaut à entrer dans le serveur lui-même de cette page Web et à prétendre qu'il explore des données.

Pour les pages Web anti-crawler, vous pouvez définir certaines informations d'en-tête pour simuler un navigateur accédant au site Web.

Comment définir les en-têtes de requête pour le robot d'exploration Python

en-têtes

Navigateur Google ou Firefox, cliquez sur la page web : clic droit – Inspecter ; cliquez sur Plus d'outils – Développement ou outil ; vous pouvez également directement F12. Appuyez ensuite sur Fn+F5 pour actualiser la page Web afin d'afficher les éléments

Certains navigateurs cliquent : clic droit -> Afficher les éléments, actualiser

Recommandations associées : "Tutoriel vidéo Python

Comment définir les en-têtes de requête pour le robot dexploration Python

Remarque : Il existe de nombreux contenus dans les en-têtes, les principaux couramment utilisés sont l'agent utilisateur et l'hôte. Ils sont affichés sous forme de paires de clés If. user-agent Si vous utilisez des paires de clés de dictionnaire comme contenu des en-têtes, vous pouvez réussir l'analyse inverse et aucune autre paire de clés n'est nécessaire, sinon vous devez ajouter d'autres paires de clés sous les en-têtes ;

Paramètres

import urllib2
import urllib
values={"username":"xxxx","password":"xxxxx"}
data=urllib.urlencode(values)
url= "https://ssl.gstatic.com/gb/images/v2_730ffe61.png"
user_agent="Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"
referer='http://www.google.com/'
headers={"User-Agent":user_agent,'Referer':referer}
request=urllib2.Request(url,data,headers)
response=urllib2.urlopen(request)
print response.read()

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn