什麼是 Python GIL,它是如何運作的,以及它如何影響 gunicorn。
生產環境我該選擇哪一種 Gunicorn worker類型?
Python 有一個全域鎖定 (GIL),它只允許一個執行緒運行(即解釋字節碼)。在我看來,如果你想優化你的 Python 服務,理解 Python 如何處理並發是必不可少的。
Python 和 gunicorn 為您提供了處理並發的不同方法,並且由於沒有涵蓋所有用例的靈丹妙藥,因此最好了解每個選項的選項、權衡和優勢。
Gunicorn 以「workers types」的概念公開了這些不同的選項。每種類型都適用於一組特定的用例。
這是最簡單的工作類型,其中唯一的並發選項是分叉N個進程,它們將並行地服務請求。
它們可以很好地工作,但會招致大量開銷(例如記憶體和CPU上下文切換),而且如果您的大部分請求時間都在等待I/O,那麼伸縮性就不好。
gthread worker 透過讓您為每個流程建立 N 個執行緒來改進這一點。這提高了 I/O 效能,因為您可以同時執行更多程式碼實例。這是受 GIL 影響的四個中唯一一個。
eventlet/gevent workers試圖透過執行輕量級使用者執行緒(又稱綠色執行緒、greenlets 等)來進一步改進 gthread 模型。
與系統執行緒相比,這允許您以很少的成本擁有數千個所述的greenlet。 另一個差異是它遵循協作工作模式而不是搶佔式,允許不間斷工作,直到它們阻塞為止。我們將首先分析 gthread 工作執行緒在處理請求時的行為以及它如何受 GIL 影響。
與每個請求直接由一個進程提供服務的sync不同,使用gthread,每個進程都有N 個線程,以便更好地擴展,而無需產生多個進程的開銷。由於您在同一個進程中運行多個線程,GIL 將阻止它們並行運行。
GIL 不是行程或特殊執行緒。它只是一個布林變量,其存取受互斥鎖保護,用於確保每個進程內只有一個執行緒在運行。它的運作方式可以在上圖中看到。在這個例子中,我們可以看到我們有 2 個系統執行緒並發運行,每個執行緒處理 1 個請求。流程是這樣的:
#在不使用進程的情況下增加並發性的另一個選擇是使用greenlets。該worker產生“用戶線程”而不是“系統線程”以增加並發性。
儘管這意味著它們不受 GIL 的影響,但這也意味著您仍然無法增加並行度,因為它們無法由 CPU 並行調度。
對於這種情況,很明顯,擁有一個 greenlet 類型的worker並不理想。我們最終讓第二個請求等到第一個請求完成,然後再次空閒等待 I/O。
在這些場景中,greenlet 協作模型真的很出色,因為您不會在上下文切換上浪費時間並避免運行多個系統執行緒的開銷。
我們將在本文最後的基準測試中見證這一點。 現在,這引出了以下問題:
要回答這些問題,您需要進行監控以收集必要的指標,然後針對這些相同的指標執行量身定制的基準測試。執行與您的實際使用模式零相關性的綜合基準測試是沒有用的 下圖顯示了不同場景的延遲和吞吐量指標,讓您了解這一切是如何協同工作的。
在這裡我們可以看到更改 GIL 執行緒切換間隔/逾時如何影響請求延遲。正如預期的那樣,IO 延遲隨著切換間隔的降低而變得更好。發生這種情況是因為受 CPU 限制的執行緒被迫更頻繁地釋放 GIL 並允許其他執行緒完成它們的工作。
但這不是靈丹妙藥。減少切換間隔將使 CPU 綁定執行緒需要更長的時間才能完成。我們也可以看到總延遲增加,由於恆定執行緒切換的開銷增加,超時時間減少。如果您想自己嘗試,可以使用以下程式碼變更切換間隔:
#總的來說,我們可以看到基準測試反映了我們先前對GIL 綁定執行緒和greenlet 如何運作的分析所產生的直覺。
由於切換間隔迫使長時間運行的執行緒釋放,gthread 對於 IO 綁定請求具有更好的平均延遲。
gevent CPU 綁定請求比 gthread 具有更好的延遲,因為它們不會中斷以服務其他請求。
這裡的結果也反映了我們之前對gevent 比gthread具有更好吞吐量的直覺。這些基準高度依賴完成的工作類型,不一定直接轉換為您的用例。
這些基準測試的主要目標是為您提供一些有關測試和測量內容的指南,以便最大限度地提高將服務於請求的每個 CPU 核心。
由於所有 gunicorn worker 都允許您指定將運行的進程數,因此更改的是每個進程如何處理並發連接。因此,請確保使用相同數量的worker以使測試公平。現在讓我們嘗試使用從我們的基準測試中收集的數據來回答前面的問題。
#確實如此。然而,對於絕大多數工作負載來說,它並沒有改變遊戲規則。
當您混合使用 I/O 和 CPU 工作時,如何在 gevent/eventlet 和 gthread 之間進行選擇?正如我們所看到的,當您有更多 CPU 密集型工作時,ghtread 往往允許更好的並發性。
只要您的基準測試能夠模擬類似生產的行為,您就會清楚地看到峰值效能,然後它會因線程過多而開始下降。
我應該只使用同步工作者並增加分叉進程的數量來避免 GIL 嗎?
除非您的 I/O 幾乎為零,否則僅使用進程進行擴充並不是最佳選擇。
Coroutines/Greenlets 可以提高 CPU 效率,因為它們避免了執行緒之間的中斷和上下文切換。協程用延遲換取吞吐量。
如果您混合使用 IO 和 CPU 綁定端點,協程可能會導致更難以預測的延遲-CPU 綁定端點不會中斷以服務其他傳入請求。如果您花時間正確配置 gunicorn,GIL 不是問題。
以上是一文搞懂 Gunicorn 與 Python GIL的詳細內容。更多資訊請關注PHP中文網其他相關文章!