Maison >développement back-end >Tutoriel Python >Explication détaillée de l'utilisation du module Requests de Python
Le module Requests est un module utilisé pour l'accès au réseau. En fait, il existe de nombreux modules similaires, tels que urllib, urllib2, httplib, httplib2. Ils fournissent essentiellement des fonctions similaires, alors pourquoi le module Requests peut-il se démarquer ? Vous pouvez ouvrir son site officiel et y jeter un œil. Il s'agit d'un module http pour les « êtres humains ». Alors, à quel point est-ce humain ? Je pense que si vous avez déjà utilisé des modules tels que urllib, vous constaterez qu'il est effectivement très convivial.
Une fois le téléchargement terminé, l'importation du module est très simple. Le code est le suivant :
import requests
r=requests.get("http://php.cn/justTest")Maintenant, nous obtenons un objet de réponse r, nous pouvons utiliser cet objet pour obtenir toutes les informations que nous voulons. Dans l'exemple ci-dessus, la requête get n'a aucun paramètre. Que se passe-t-il si la requête nécessite des paramètres ? 2. Envoyez une demande d'obtention avec des paramètres
payload = {'key1': 'value1', 'key2': 'value2'} r = requests.get("http://php.cn/justTest", params=payload)Comme nous le savons d'après ce qui précède, nos paramètres d'obtention sont transmis en tant que paramètres de mot-clé params. Nous pouvons imprimer l'URL spécifique demandée pour voir si elle est correcte :
>>>print r.url http://pythontab.com/justTest?key2=value2&key1=value1Vous pouvez voir que l'URL correcte a bien été consultée. Vous pouvez également transmettre une liste à un paramètre de requête :
>>> payload = {'key1': 'value1', 'key2': ['value2', 'value3']} >>> r = requests.get("http://php.cn/justTest", params=payload) >>> print r.url http://pythontab.com/justTest?key1=value1&key2=value2&key2=value3Ce qui précède est le formulaire de base de la requête get. 3. Envoyer une demande de publication
r = requests.post("http://php.cn/postTest", data = {"key":"value"})Comme vous pouvez le voir ci-dessus, les paramètres de demande de publication sont transmis en tant que paramètres de mots-clés de données. Le paramètre de données actuel transmet un dictionnaire. Nous pouvons également transmettre des données au format json, comme suit :
>>> import json >>> import requests >>> payload = {"key":"value"} >>> r = requests.post("http://php.cn/postTest", data = json.dumps(payload))Comme il est trop courant d'envoyer des données au format json, dans le module Requêtes. Dans la version supérieure, le paramètre de mot-clé json a été ajouté. Vous pouvez envoyer directement des données json à la requête de publication sans utiliser le module json. Voir ci-dessous :
>>> payload = {"key":"value"} >>> r = requests.post("http://php.cn/postTest", json=payload)Et si nous voulons publier un fichier ? ? A ce moment, vous devez utiliser le paramètre files :
>>> url = 'http://php.cn/postTest' >>> files = {'file': open('report.xls', 'rb')} >>> r = requests.post(url, files=files) >>> r.textNous pouvons également préciser des informations supplémentaires telles que le nom du fichier lors de la publication du fichier :
>>> url = 'http://php.cn/postTest' >>> files = {'file': ('report.xls', open('report.xls', 'rb'), 'application/vnd.ms-excel', {'Expires': '0'})} >>> r = requests.post(url, files=files)conseils : Il est Il est fortement recommandé d'utiliser le mode binaire. Ouvrez le fichier, car si vous l'ouvrez au format texte, une erreur peut survenir à cause de l'en-tête "Content-Length". Comme vous pouvez le constater, il est facile d'envoyer des requêtes en utilisant Requêtes ! 3. Obtenir les informations de retour Voyons comment obtenir les informations de retour après l'envoi de la demande. Continuons à utiliser l'exemple du haut :
>>> import requests >>> r=requests.get('http://php.cn/justTest') >>> r.textDans quel format d'encodage la sortie r.text est-elle ?
>>> r.encoding 'utf-8'a été initialement sorti au format utf-8. Que faire si je souhaite modifier le format de sortie de r.text ?
>>> r.encoding = 'ISO-8859-1'Cela change le format de sortie en "ISO-8859-1". Il existe également une instruction de sortie appelée r.content, alors quelle est la différence entre celle-ci et r.text ? r.content renvoie un flux d'octets, qui peut être utilisé si nous demandons une adresse d'image et souhaitons enregistrer l'image. Voici un extrait de code comme suit :
def saveImage( imgUrl,imgName ="default.jpg" ): r = requests.get(imgUrl, stream=True) image = r.content destDir="D:\" print("保存图片"+destDir+imgName+"\n") try: with open(destDir+imgName ,"wb") as jpg: jpg.write(image) return except IOError: print("IO Error") return finally: jpg.closeLe r.text qui vient d'être introduit est renvoyé. une chaîne, donc si la réponse correspondant à la requête est un json, puis-je récupérer directement les données au format json ? r.json() est préparé pour cela. Nous pouvons également récupérer les données originales renvoyées par le serveur, il suffit d'utiliser r.raw.read(). Cependant, si vous souhaitez vraiment obtenir les données de retour d'origine, n'oubliez pas d'ajouter l'option "stream=True" lors de la demande, par exemple :
r = requests.get('https://api.github.com/events', stream=True)。Nous pouvons également obtenir le code d'état de la réponse :
>>> r = requests.get('http://php.cn/justTest') >>> r.status_code 200Vous pouvez également utiliser request.codes.ok pour faire référence à la valeur de retour de 200 :
>>> r.status_code == requests.codes.ok True4 Concernant les en-têtesNous pouvons imprimer l'en-tête de réponse. :
>>> r= requests.get("http://php.cn/justTest") >>> r.headers`r.headers` renvoie un dictionnaire, par exemple :
{ 'content-encoding': 'gzip', 'transfer-encoding': 'chunked', 'connection': 'close', 'server': 'nginx/1.0.4', 'x-runtime': '147ms', 'etag': '"e1ca502697e5c9317743dc078f67693a"', 'content-type': 'application/json' }Nous pouvons utiliser la méthode suivante pour obtenir des en-têtes de réponse pour jugement :
r.headers['Content-Type']Ou
r.headers.get('Content-Type')Et si nous voulons obtenir l'en-tête de la requête (c'est-à-dire les informations d'en-tête que nous envoyons au serveur) ? Peut être obtenu directement en utilisant r.request.headers. En même temps, nous pouvons également ajouter des en-têtes personnalisés (transmis via les paramètres de mots-clés des en-têtes) lors de la demande de données :
>>> headers = {'user-agent': 'myagent'} >>> r= requests.get("http://php.cn/justTest",headers=headers)5 À propos des cookiesSi si un. La réponse contient des cookies, nous pouvons utiliser la méthode suivante pour les obtenir :
>>> url = 'http://www.php.cn' >>> r = requests.get(url) >>> r.cookies['example_cookie_name'] 'example_cookie_value'Nous pouvons également envoyer nos propres cookies (en utilisant le paramètre de mot-clé cookies) :
>>> url = 'http://php.cn/cookies' >>> cookies={'cookies_are':'working'} >>> r = requests.get(url, cookies=cookies)6. À propos redirectionParfois, lorsque nous demandons une URL, le serveur redirigera automatiquement notre requête. Par exemple, github redirigera notre requête http vers la requête https. Nous pouvons utiliser r.history pour afficher les redirections :
>>> r = requests.get('http://php.cn/') >>> r.url 'http://php.cn/' >>> r.history []Comme vous pouvez le voir dans l'exemple ci-dessus, nous utilisons le protocole http pour accéder, mais dans r.url, le protocole https est imprimé. Alors, que dois-je faire si j'insiste pour que le serveur utilise le protocole http, ce qui signifie qu'il est interdit au serveur de rediriger automatiquement ? Utilisez le paramètre allow_redirects :
r = requests.get('http://php.cn', allow_redirects=False)7. À propos du temps de requête Nous pouvons utiliser le paramètre timeout pour définir le délai d'expiration de la requête de l'URL (l'unité de temps est en secondes) :
requests.get('http://php.cn', timeout=1)8. À propos du proxyNous pouvons également spécifier un proxy dans le programme pour l'accès http ou https (en utilisant les paramètres de mots-clés proxy), comme suit :
proxies = { "http": "http://10.10.1.10:3128", "https": "http://10.10.1.10:1080", } requests.get("http://php.cn", proxies=proxies)
我们有时候会有这样的情况,我们需要登录某个网站,然后才能请求相关url,这时就可以用到session了,我们可以先使用网站的登录api进行登录,然后得到session,最后就可以用这个session来请求其他url了:
s=requests.Session() login_data={'form_email':'youremail@example.com','form_password':'yourpassword'} s.post("http://pythontab.com/testLogin",login_data) r = s.get('http://pythontab.com/notification/') print r.text
其中,form_email和form_password是豆瓣登录框的相应元素的name值。
使用Requests模块也可以下载网页,代码如下:
r=requests.get("http://www.php.cn") with open("haha.html","wb") as html: html.write(r.content) html.close()
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!