前言
最近,群組內有一個我非常期待的分享主題:「Linux的虛擬記憶體」。某天晚上加班時,我們在討論虛擬記憶體的概念時,我們的領導發現幾位同事對虛擬記憶體的理解不夠清晰,於是特意為這位同事挑選了這個主題(笑)。
之前,我對作業系統的概念有一些了解,但畢業後我對自己大學四年的電腦專業的荒廢感到有些懊悔。因此,在工作之餘,我抽出時間觀看了哈爾濱工業大學在網易雲課堂上的操作系統公開課,也閱讀了一本講解操作系統概念較淺的書籍《Linux核心設計與實現》。此外,去年我使用C語言編寫了一個簡單的伺服器,深入了解了更多系統底層的知識。這些知識讓我對應用層的知識有了更好的掌握,並在最近一次故障排查中給予了我很大的幫助。
前幾天,另一位同事向我提出了另一個與虛擬記憶體相關的問題,我才意識到對虛擬記憶體的理解還不夠深刻,有些概念甚至存在矛盾。因此,我翻閱了一些資料,並重新整理了這些知識,希望下次在實際應用時能更加流暢。
起源
虛擬記憶體
#毫無疑問,虛擬記憶體絕對是作業系統中最重要的概念之一。我認為主要是因為內在整個系統中存在的重要性地位。 CPU速度非常快,但容量有限且功能單一,而其他的I/O硬體在各種花式功能方面都有支持,但相對於CPU來說它們速度較慢。因此,它們之間需要一種潤滑劑作為緩衝,這就是記憶體發揮作用的地方。
在現代作業系統中,多任務已經成為標配。多任務並行大大提高了CPU的使用率,但也帶來了多個進程對記憶體操作的衝突問題,而虛擬記憶體的概念就是為了解決這個問題。

上圖是虛擬記憶體最簡單也是最直覺的解釋。
作業系統有一塊實體記憶體(中間的部分),有兩個行程(實際上會更多)P1 和P2,作業系統偷偷地分別告訴P1 和P2,我的整個記憶體都是你的,隨便用,管夠。但事實上呢,作業系統只是給它們畫了個大餅,這些記憶體說是都給了 P1 和 P2,實際上只給了它們一個序號而已。只有當P1 和P2 真正開始使用這些內存時,系統才開始使用輾轉挪移,拼湊出各個塊給進程用,P2 以為自己在用A 內存,實際上已經被系統悄悄重定向到真正的B 去了,甚至,當P1 和P2 共用了C 內存,他們也不知道。
作業系統的這種欺騙進程的手段,就是虛擬記憶體。對 P1 和 P2 等進程來說,它們都以為自己佔用了整個內存,而自己使用的物理內存的哪段地址,它們並不知道也無需關心。
分頁與頁表
#虛擬記憶體是作業系統裡的概念,對作業系統來說,虛擬記憶體就是一張張的對照表,P1 取得A 記憶體裡的資料時應該去實體記憶體的A 位址找,而找B 記憶體裡的資料應該去物理記憶體的C 位址。
我們知道系統裡的基本單位都是Byte 字節,如果將每個虛擬記憶體的Byte 對應到物理記憶體的位址,每個條目最少需要8位元組(32位元虛擬位址->32位元物理位址),在4G 記憶體的情況下,就需要32GB 的空間來存放對照表,那麼這張表就大得真正的實體位址也放不下了,於是作業系統引入了頁(Page)
的概念。
在系統啟動時,作業系統將整個實體記憶體以 4K 為單位,劃分為各頁。之後進行內存分配時,都以頁為單位,那麼虛擬內存頁對應物理內存頁的映射表就大大減小了,4G 內存,只需要8M 的映射表即可,一些進程沒有使用到的虛擬內存,也不需要保存映射關係,而且Linux 還為大記憶體設計了多層頁表,可以進一頁減少了記憶體消耗。作業系統虛擬記憶體到實體記憶體的映射表,就稱為頁表
。
記憶體尋址與分配
#我們知道透過虛擬內存機制,每個進程都以為自己佔用了全部內存,進程訪問內存時,操作系統都會把進程提供的虛擬內存地址轉換為物理地址,再去對應的物理地址上獲取數據。 CPU 中有一種硬件,記憶體管理單元 MMU(Memory Management Unit)
專門用來將翻譯虛擬記憶體位址。 CPU 也為頁表尋址設定了快取策略,由於程式的局部性,其快取命中率能達到 98%。
以上情況是頁表內存在虛擬位址到實體位址的映射,而如果進程存取的實體位址尚未被分配,系統則會產生一個缺頁中斷
,中斷處理時,系統切到核心態為進程虛擬位址分配實體位址。
功能
虛擬記憶體不僅透過記憶體位址轉換解決了多個進程存取記憶體衝突的問題,還帶來更多的好處。
進程記憶體管理
#它有助於進程進行記憶體管理,主要體現在:
- 記憶體完整性:由於虛擬記憶體對進程的”欺騙”,每個進程都認為自己獲取的記憶體是一塊連續的位址。我們在編寫應用程式時,就不用考慮大塊位址的分配,總是認為系統有足夠的大塊記憶體即可。
- 安全性:由於進程存取記憶體時,都要透過頁表來定址,作業系統在頁表的各個項目上新增各種存取權限識別位,就可以實現記憶體的權限控制。
資料共享
#透過虛擬記憶體更容易實現記憶體和資料的共享。
在進程加載系統庫時,總是先分配一塊內存,將磁碟中的庫文件加載到這塊內存中,在直接使用物理內存時,由於物理內存地址唯一,即使系統發現同一個庫在系統內載入了兩次,但每個行程指定的載入記憶體不一樣,系統也無能為力。
而在使用虛擬記憶體時,系統只需要將進程的虛擬記憶體位址指向庫檔案所在的實體記憶體位址。如上文圖中所示,進程 P1 和 P2 的 B 位址都指向了實體位址 C。
而透過使用虛擬記憶體使用共享記憶體也很簡單,系統只需要將各個進程的虛擬記憶體位址指向系統分配的共享記憶體位址。
SWAP
虛擬記憶體可以讓幫進程」擴充」記憶體。
我們前文提到了虛擬記憶體透過缺頁中斷為進程分配物理內存,記憶體總是有限的,如果所有的實體記憶體都被佔用了怎麼辦呢?
Linux 提出SWAP 的概念,Linux 中可以使用SWAP 分區,在分配物理內存,但可用內存不足時,將暫時不用的內存資料先放到磁碟上,讓有需要的進程先使用,等進程再需要使用這些資料時,再將這些資料載入到記憶體中,透過這種」交換」技術,Linux 可以讓進程使用更多的記憶體。
常見問題
在了解虛擬記憶體時,我也有過很多的問題。
32位元和64位元
最常見的就是 32位元和64位元的問題了。
CPU 透過實體匯流排存取內存,那麼存取位址的範圍就受限於機器匯流排的數量,在32位元機器上,有32條匯流排,每條匯流排有高低兩種電位分別代表bit 的1 和0 ,那麼可存取的最大位址就是2^32bit = 4GB,所以說32 位元機器上插入大於4G 的記憶體是無效的,CPU 存取不到多於4G 的記憶體。
但 64位元機器並沒有 64位元匯流排,而且其最大記憶體還要受限於作業系統,Linux 目前支援最大 256G 記憶體。
根據虛擬記憶體的概念,在 32 位元系統上運行 64 位元軟體也並無不可,但由於系統對虛擬記憶體位址的結構設計,64位元的虛擬位址在32位元系統內並不能使用。
直接操作物理記憶體
#作業系統使用了虛擬內存,我們想要直接操作記憶體該怎麼辦?
Linux 會將各個設備都映射到 /dev/
目錄下的文件,我們可以透過這些設備文件直接操作硬件,內存也不例外。在 Linux 中,記憶體設定被映射為 /dev/mem
,root 使用者透過對這個檔案讀寫,可以直接操作記憶體。
JVM 進程佔用虛擬記憶體過多
使用 TOP 查看系統效能時,我們會發現在 VIRT 這一列,Java 進程會佔用大量的虛擬記憶體。

導致這種問題的原因是 Java 使用 Glibc 的 Arena 記憶體池分配了大量的虛擬記憶體並沒有使用。此外,Java 讀取的檔案也會被映射為虛擬內存,在虛擬機器預設配置下 Java 每個線程堆疊會佔用 1M 的虛擬內存。具體可以查看 為什麼linux下多執行緒程式如此消耗虛擬記憶體。
而真實佔用的實體記憶體要看 RES
(resident) 列,這一列的值才是真正被對應到實體記憶體的大小。
常用管理指令
#我們也可以自己來管理 Linux 的虛擬記憶體。
查看系統記憶體狀態
#查看系統記憶體狀況的方式有很多,free
、 vmstat
等指令都可輸出目前系統的記憶體狀態,需要注意的是可用記憶體不只是free 這一列,由於作業系統的lazy 特性,大量的buffer/cache 在進程不再使用後,不會被立即清理,如果之前使用它們的進程再次運行還可以繼續使用,它們在必要時也是可以被利用的。
此外,透過 cat /proc/meminfo
可以查看系統記憶體被使用的詳細情況,包括髒頁狀態等。詳情請見:/PROC/MEMINFO之謎。
pmap
#如果想單獨查看某一進程的虛擬記憶體分佈情況,可以使用 pmap pid
指令,它會把虛擬記憶體各段的佔用情況從低位址到高位址都列出來。
可以加入 -XX
參數來輸出更詳細的資訊。
修改記憶體配置
#我們也可以修改Linux 的系統配置,使用sysctl vm [-options] CONFIG
或直接讀寫/proc/sys/vm/
目錄下的檔案來檢視和修改配置。
SWAP 操作
#虛擬記憶體的 SWAP 特性並不總是有益,放任進程不停地將資料在記憶體與磁碟之間大量交換會大大佔用 CPU,降低系統運作效率,所以有時我們並不希望使用 swap。
我們可以修改 vm.swappiness=0
來設定記憶體盡量少使用 swap,或乾脆使用 swapoff
指令停用掉 SWAP。
小結
虛擬記憶體的概念非常容易理解,但是它會衍生出來的一系列非常複雜的知識。本文只講了些基本原理,略過了許多細節,例如虛擬記憶體尋址中段暫存器的使用,作業系統使用虛擬記憶體增強快取、緩衝區的應用程式等,有機會單獨拿出來說。
以上是Linux虛擬內存,你理解到位了?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本指南詳細介紹瞭如何使用SystemD配置自動服務在Linux中重新啟動,從而增強了系統的可靠性並最大程度地減少停機時間。 系統管理員通常依靠此功能來確保關鍵服務,例如Web服務器(APA

作為Linux用戶,我們經常依賴常用的命令ls、grep、awk、sed和find來完成工作。但Linux擁有大量鮮為人知的命令,可以節省時間、自動化任務並簡化工作流程。 本文將探討一些被低估但卻功能強大的Linux命令,它們值得更多關注。 rename – 高效批量重命名文件 當您需要一次重命名多個文件時,rename命令是救星。無需使用包含mv的循環,rename允許您輕鬆應用複雜的重命名模式。 將所有.txt文件更改為.log。 rename 's/\.txt$/\.log/' *

Linux 系統提供各種系統服務(例如進程管理、登錄、syslog、cron 等)和網絡服務(例如遠程登錄、電子郵件、打印機、Web 託管、數據存儲、文件傳輸、域名解析(使用 DNS)、動態 IP 地址分配(使用 DHCP)等等)。 從技術上講,服務是在後台持續運行的進程或進程組(通常稱為 守護進程),等待傳入請求(尤其來自客戶端)。 Linux 支持不同的方式來管理(啟動、停止、重啟、啟用系統啟動時的自動啟動等)服務,通常通過進程或服務管理器。幾乎所有現代 Linux 發行版現在都使用相同的進

使用Crossover 25運行Windows軟件和遊戲 由於CodeWeavers的Crossover 25,在Linux上運行Windows應用程序和遊戲現在比以往任何時候都容易。 這個商業軟件解決方案讓Linux用戶運行各種各樣的風
![PCLOUD-最安全的雲存儲[優惠50%]](https://img.php.cn/upload/article/001/242/473/174580357418126.jpg?x-oss-process=image/resize,p_40)
使用PCLOUD保護數據:Linux安裝的綜合指南 領先的安全雲存儲服務PCloud提供了一個可靠的平台來管理您的文件和數據。本指南詳細介紹了Linux系統上的安裝過程。 關於

MangoHud:實時監控Linux遊戲性能的利器 MangoHud是一款功能強大且輕量級的工具,專為遊戲玩家、開發者以及任何希望實時監控系統性能的用戶而設計。它作為Vulkan和OpenGL應用程序的疊加層,顯示FPS、CPU和GPU使用率、溫度等重要信息。本文將探討MangoHud的功能、工作原理以及使用方法,並提供在Linux系統上安裝和配置MangoHud的分步說明。 MangoHud是什麼? MangoHud是一個開源項目,可在GitHub上獲取,旨在提供一種簡單且可自定義的方式來監

管理存檔文件是Linux中的常見任務。本文是兩部分系列中的第一篇,探討了五種強大的命令行檔案工具,詳細介紹了他們的功能和示例的用法。 1。焦油命令:多功能存檔實用程序 t

本指南探討了用於比較Linux中文本文件的各種方法,Linux是系統管理員和開發人員的關鍵任務。 我們將介紹命令行工具和視覺差異工具,突出顯示其優勢和適當的用例。 假設


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

記事本++7.3.1
好用且免費的程式碼編輯器

Dreamweaver Mac版
視覺化網頁開發工具

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。