Requests 是一個 Python 模組,可用來傳送各種 HTTP 請求。它是一個易於使用的庫,具有許多功能,從在 URL 中傳遞參數到發送自訂標頭和 SSL 驗證。在本教程中,您將學習如何使用該程式庫在 Python 中發送簡單的 HTTP 請求。
您可以在 Python 版本 2.6–2.7 和 3.3–3.6 中使用請求。在繼續之前,您應該知道 Requests 是一個外部模組,因此在嘗試本教學中的範例之前必須先安裝它。您可以透過在終端機中執行以下命令來安裝它:
pip install requests
安裝模組後,您可以使用以下命令導入模組來驗證是否已成功安裝:
import requests
如果安裝成功,您將不會看到任何錯誤訊息。
發出 GET 請求
使用 Requests 發送 HTTP 請求非常容易。您先匯入模組,然後發出請求。這是一個例子:
import requests req = requests.get('https://tutsplus.com/')
有關我們請求的所有資訊現在都儲存在名為 req
的回應物件中。例如,您可以使用 req.encoding
屬性來取得網頁的編碼。您也可以使用 req.status_code
屬性來取得請求的狀態代碼。
req.encoding # returns 'utf-8' req.status_code # returns 200
您可以使用 req.cookies
存取伺服器傳回的 cookie。同樣,您可以使用 req.headers
來取得回應標頭。 req.headers
屬性傳回回應標頭的不區分大小寫的字典。這意味著 req.headers['Content-Length']
、req.headers['content-length']
和 req。 headers['CONTENT-LENGTH']
都會傳回 'Content-Length'
回應頭的值。
您可以檢查回應是否為格式良好的 HTTP 重新導向,可以使用 req.is_redirect
屬性自動處理。它將根據回應傳回 True
或 False
。您也可以使用 req.elapsed
屬性來取得傳送請求和取得回應之間經過的時間。
由於多種原因(包括重定向),您最初傳遞給 get()
函數的 URL 可能與回應的最終 URL 不同。若要查看最終的回應 URL,您可以使用 req.url
屬性。
import requests req = requests.get('https://www.tutsplus.com/') req.encoding # returns 'utf-8' req.status_code # returns 200 req.elapsed # returns datetime.timedelta(0, 1, 666890) req.url # returns 'https://tutsplus.com/' req.history # returns [<Response [301]>, <Response [301]>] req.headers['Content-Type'] # returns 'text/html; charset=utf-8'
獲取有關您正在訪問的網頁的所有這些資訊固然很好,但您很可能想要訪問實際內容。如果您造訪的內容是文本,則可以使用 req.text
屬性來存取它。然後內容被解析為 unicode。您可以使用 req.encoding
屬性傳遞用於解碼文字的編碼。
對於非文字回應,您可以使用 req.content
以二進位形式存取它們。此模組將自動解碼 gzip
和 deflate
傳輸編碼。當您處理媒體檔案時,這會很有幫助。同樣,您可以使用 req.json()
存取回應的 json 編碼內容(如果存在)。
您也可以使用 req.raw
從伺服器取得原始回應。請記住,您必須在請求中傳遞 stream=True
才能取得原始回應。
您使用請求模組從 Internet 下載的某些檔案可能會很大。在這種情況下,立即將整個回應或檔案載入到記憶體中是不明智的。您可以使用 iter_content(chunk_size = 1,decode_unicode=False)
方法分割或區塊下載檔案。
此方法一次迭代 chunk_size
位元組數中的回應資料。當請求上設定了 stream=True
時,此方法將避免一次將整個檔案讀入記憶體以獲得大量回應。 chunk_size
參數可以是整數,也可以是 None
。當設定為整數值時,chunk_size
決定應讀入記憶體的位元組數。
當chunk_size
設定為None
且stream
設定為True
時,資料會被讀取為無論收到的區塊大小如何,它都會到達。當 chunk_size
設定為 None
且 stream
設為 False
時,所有資料將作為單一傳回區塊。
讓我們使用請求模組下載一些蘑菇的映像。這是實際圖像:
#這是您需要的程式碼:
import requests req = requests.get('path/to/mushrooms.jpg', stream=True) req.raise_for_status() with open('mushrooms.jpg', 'wb') as fd: for chunk in req.iter_content(chunk_size=50000): print('Received a Chunk') fd.write(chunk)
'path/to/mushrooms.jpg'
是实际的图像 URL。您可以将任何其他图像的 URL 放在这里来下载其他内容。给定的图像文件大小为 162kb,并且您已将 chunk_size
设置为 50,000 字节。这意味着“Received a Chunk”消息应在终端中打印四次。最后一个块的大小将仅为 32350 字节,因为前三次迭代后仍待接收的文件部分为 32350 字节。
您还可以用类似的方式下载视频。我们可以简单地将其值设置为 None
,而不是指定固定的 chunk_size
,然后视频将以提供的任何块大小下载。以下代码片段将从 Mixkit 下载高速公路的视频:
import requests req = requests.get('path/to/highway/video.mp4', stream=True) req.raise_for_status() with open('highway.mp4', 'wb') as fd: for chunk in req.iter_content(chunk_size=None): print('Received a Chunk') fd.write(chunk)
尝试运行代码,您将看到视频作为单个块下载。
如果您决定使用 stream
参数,则应记住以下几点。响应正文的下载会被推迟,直到您使用 content
属性实际访问其值。这样,如果某些标头值之一看起来不正确,您就可以避免下载文件。
另请记住,在将流的值设置为 True
时启动的任何连接都不会关闭,除非您消耗所有数据或使用 close()
方法。确保连接始终关闭的更好方法是在 with
语句中发出请求,即使您部分读取了响应,如下所示:
import requests with requests.get('path/to/highway/video.mp4', stream=True) as rq: with open('highway.mp4', 'wb') as fd: for chunk in rq.iter_content(chunk_size=None): print('Received a Chunk') fd.write(chunk)
由于我们之前下载的图片文件比较小,您也可以使用以下代码一次性下载:
import requests req = requests.get('path/to/mushrooms.jpg') req.raise_for_status() with open('mushrooms.jpg', 'wb') as fd: fd.write(req.content)
我们跳过了设置 stream
参数的值,因此默认设置为 False
。这意味着所有响应内容将立即下载。借助 content
属性,将响应内容捕获为二进制数据。
请求还允许您在 URL 中传递参数。当您在网页上搜索某些结果(例如特定图像或教程)时,这会很有帮助。您可以使用 GET 请求中的 params
关键字将这些查询字符串作为字符串字典提供。这是一个例子:
import requests query = {'q': 'Forest', 'order': 'popular', 'min_width': '800', 'min_height': '600'} req = requests.get('https://pixabay.com/en/photos/', params=query) req.url # returns 'https://pixabay.com/en/photos/?order=popular&min_height=600&q=Forest&min_width=800'
发出 POST 请求
发出 POST 请求与发出 GET 请求一样简单。您只需使用 post()
方法而不是 get()
即可。当您自动提交表单时,这会很有用。例如,以下代码将向 httpbin.org 域发送 post 请求,并将响应 JSON 作为文本输出。
import requests req = requests.post('https://httpbin.org/post', data = {'username': 'monty', 'password': 'something_complicated'}) req.raise_for_status() print(req.text) ''' { "args": {}, "data": "", "files": {}, "form": { "password": "something_complicated", "username": "monty" }, "headers": { "Accept": "*/*", "Accept-Encoding": "gzip, deflate", "Content-Length": "45", "Content-Type": "application/x-www-form-urlencoded", "Host": "httpbin.org", "User-Agent": "python-requests/2.28.1", "X-Amzn-Trace-Id": "Root=1-63ad437e-67f5db6a161314861484f2eb" }, "json": null, "origin": "YOUR.IP.ADDRESS", "url": "https://httpbin.org/post" } '''
您可以将这些 POST 请求发送到任何可以处理它们的 URL。举个例子,我的一位朋友创建了一个网页,用户可以在其中输入单词并使用 API 获取其含义以及发音和其他信息。我们可以用我们查询的单词向URL发出POST请求,然后将结果保存为HTML页面,如下所示:
import requests word = 'Pulchritudinous' filename = word.lower() + '.html' req = requests.post('https://tutorialio.com/tools/dictionary.php', data = {'query': word}) req.raise_for_status() with open(filename, 'wb') as fd: fd.write(req.content)
执行上面的代码,它会返回一个包含该单词信息的页面,如下图所示。
发送 Cookie 和标头
如前所述,您可以使用 req.cookies
和 req.headers
访问服务器发回给您的 cookie 和标头。请求还允许您通过请求发送您自己的自定义 cookie 和标头。当您想要为您的请求设置自定义用户代理时,这会很有帮助。
要将 HTTP 标头添加到请求中,您只需将它们通过 dict
传递到 headers
参数即可。同样,您还可以使用传递给 cookies
参数的 dict
将自己的 cookie 发送到服务器。
import requests url = 'http://some-domain.com/set/cookies/headers' headers = {'user-agent': 'your-own-user-agent/0.0.1'} cookies = {'visit-month': 'February'} req = requests.get(url, headers=headers, cookies=cookies)
Cookie 也可以在 Cookie Jar 中传递。它们提供了更完整的界面,允许您通过多个路径使用这些 cookie。这是一个例子:
import requests jar = requests.cookies.RequestsCookieJar() jar.set('first_cookie', 'first', domain='httpbin.org', path='/cookies') jar.set('second_cookie', 'second', domain='httpbin.org', path='/extra') jar.set('third_cookie', 'third', domain='httpbin.org', path='/cookies') url = 'http://httpbin.org/cookies' req = requests.get(url, cookies=jar) req.text # returns '{ "cookies": { "first_cookie": "first", "third_cookie": "third" }}'
会话对象
有时,在多个请求中保留某些参数很有用。 Session 对象正是这样做的。例如,它将在使用同一会话发出的所有请求中保留 cookie 数据。 Session 对象使用 urllib3 的连接池。这意味着底层 TCP 连接将被重复用于向同一主机发出的所有请求。这可以显着提高性能。您还可以将 Requests 对象的方法与 Session 对象一起使用。
以下是使用和不使用会话发送的多个请求的示例:
import requests reqOne = requests.get('https://tutsplus.com/') reqOne.cookies['_tuts_session'] #returns 'cc118d94a84f0ea37c64f14dd868a175' reqTwo = requests.get('https://code.tutsplus.com/tutorials') reqTwo.cookies['_tuts_session'] #returns '3775e1f1d7f3448e25881dfc35b8a69a' ssnOne = requests.Session() ssnOne.get('https://tutsplus.com/') ssnOne.cookies['_tuts_session'] #returns '4c3dd2f41d2362108fbb191448eab3b4' reqThree = ssnOne.get('https://code.tutsplus.com/tutorials') reqThree.cookies['_tuts_session'] #returns '4c3dd2f41d2362108fbb191448eab3b4'
正如您所看到的,会话cookie在第一个和第二个请求中具有不同的值,但当我们使用Session对象时它具有相同的值。当您尝试此代码时,您将获得不同的值,但在您的情况下,使用会话对象发出的请求的 cookie 将具有相同的值。
当您想要在所有请求中发送相同的数据时,会话也很有用。例如,如果您决定将 cookie 或用户代理标头与所有请求一起发送到给定域,则可以使用 Session 对象。这是一个例子:
import requests ssn = requests.Session() ssn.cookies.update({'visit-month': 'February'}) reqOne = ssn.get('http://httpbin.org/cookies') print(reqOne.text) # prints information about "visit-month" cookie reqTwo = ssn.get('http://httpbin.org/cookies', cookies={'visit-year': '2017'}) print(reqTwo.text) # prints information about "visit-month" and "visit-year" cookie reqThree = ssn.get('http://httpbin.org/cookies') print(reqThree.text) # prints information about "visit-month" cookie
如您所见,"visit-month"
会话 cookie 随所有三个请求一起发送。但是, "visit-year"
cookie 仅在第二次请求期间发送。第三个请求中也没有提及 "vist-year"
cookie。这证实了单个请求上设置的 cookie 或其他数据不会与其他会话请求一起发送。
结论
本教程中讨论的概念应该可以帮助您通过传递特定标头、cookie 或查询字符串来向服务器发出基本请求。当您尝试抓取网页以获取信息时,这将非常方便。现在,一旦您找出 URL 中的模式,您还应该能够自动从不同的网站下载音乐文件和壁纸。
学习 Python
无论您是刚刚入门还是希望学习新技能的经验丰富的程序员,都可以通过我们完整的 Python 教程指南学习 Python。
以上是Python使用Requests模組的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Python因其簡潔與強大而備受青睞,適用於從初學者到高級開發者的各種需求。其多功能性體現在:1)易學易用,語法簡單;2)豐富的庫和框架,如NumPy、Pandas等;3)跨平台支持,可在多種操作系統上運行;4)適合腳本和自動化任務,提升工作效率。

可以,在每天花費兩個小時的時間內學會Python。 1.制定合理的學習計劃,2.選擇合適的學習資源,3.通過實踐鞏固所學知識,這些步驟能幫助你在短時間內掌握Python。

Python適合快速開發和數據處理,而C 適合高性能和底層控制。 1)Python易用,語法簡潔,適用於數據科學和Web開發。 2)C 性能高,控制精確,常用於遊戲和系統編程。

學習Python所需時間因人而異,主要受之前的編程經驗、學習動機、學習資源和方法及學習節奏的影響。設定現實的學習目標並通過實踐項目學習效果最佳。

Python在自動化、腳本編寫和任務管理中表現出色。 1)自動化:通過標準庫如os、shutil實現文件備份。 2)腳本編寫:使用psutil庫監控系統資源。 3)任務管理:利用schedule庫調度任務。 Python的易用性和豐富庫支持使其在這些領域中成為首選工具。

要在有限的時間內最大化學習Python的效率,可以使用Python的datetime、time和schedule模塊。 1.datetime模塊用於記錄和規劃學習時間。 2.time模塊幫助設置學習和休息時間。 3.schedule模塊自動化安排每週學習任務。

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame,提供繪圖、音頻等功能,適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt,Tkinter簡單易用,PyQt功能豐富,適合專業開發。

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版
中文版,非常好用

Atom編輯器mac版下載
最受歡迎的的開源編輯器