首頁  >  文章  >  Java  >  圖文詳解!什麼是Java記憶體模型

圖文詳解!什麼是Java記憶體模型

WBOY
WBOY轉載
2022-03-22 18:00:411583瀏覽

本篇文章為大家帶來了java的相關知識,其中主要介紹了關於記憶體模型的相關問題,包括了為什麼要有記憶體模型、並發程式設計以及記憶體區域與硬體記憶體關係等等,希望對大家有幫助。

圖文詳解!什麼是Java記憶體模型

推薦學習:《java教學

在面試中,面試官常喜歡問:『說說什麼是Java記憶體模型(JMM)? ’

面試者內心狂喜,這題剛背過:『Java記憶體主要分為五大塊:堆疊、方法區、虛擬機器堆疊、本地方法堆疊、PC暫存器,balabala…’

面試官會心一笑,露出一道光芒:『好了,今天的面試先到這裡了,回去等通知吧』

一般聽到等通知這句話,這場面試大概率就是涼涼了。為什麼呢?因為面試者弄錯了概念,面試官是想考察JMM,但是面試者一聽到Java內存這幾個關鍵字就開始背誦八股文了。 Java記憶體模型(JMM)和Java運行時記憶體區域差別可大了呢,不要走開接著往下看,答應我要看完。

1. 為什麼要有記憶體模型?

要想回答這個問題,我們要先弄清楚傳統電腦硬體記憶體架構。好了,我要開始畫圖了。

1.1. 硬體記憶體架構

圖文詳解!什麼是Java記憶體模型
(1)CPU

去過機房的同學都知道,一般在大型伺服器上會配置多個CPU,每個CPU還會有多個,這意味著多個CPU或多個核心可以同時(並發)運作。如果使用Java 起了一個多線程的任務,很有可能每個 CPU 都會跑一個線程,那麼你的任務在某一刻就是真正並發執行了。

(2)CPU Register

CPU Register也就是 CPU 暫存器。 CPU 暫存器是 CPU 內部整合的,在暫存器上執行操作的效率比在主記憶體上高出幾個數量級。

(3)CPU Cache Memory

CPU Cache Memory也就是 CPU 快取,相對於暫存器來說,通常也可以成為 L2 二級快取。相對於硬碟讀取速度來說記憶體讀取的效率非常高,但是與 CPU 還是相差數量級,所以在 CPU 和主記憶體引入了多級緩存,目的是為了做緩衝。

(4)Main Memory

Main Memory 是主記憶體,主記憶體比 L1、L2 快取大很多。

注意:部分高階機器還有 L3 三級快取。

1.2. 快取一致性問題

由於主記憶體與CPU 處理器的運算能力之間有數量級的差距,所以在傳統電腦記憶體架構中會引入快取和處理器之間的緩衝,CPU 將常用的資料放在高速緩存中,運算結束後CPU 再講運算結果同步到主記憶體。

使用快取解決了 CPU 和主記憶體速率不匹配的問題,但同時又引入另一個新問題:快取一致性問題。
圖文詳解!什麼是Java記憶體模型
在多CPU的系統中(或單CPU多核心的系統),每個CPU核心都有自己的高速緩存,它們共享同一主記憶體(Main Memory)。當多個CPU的運算任務都涉及同一塊主記憶體區域時,CPU 會將資料讀取到快取中進行運算,這可能會導致各自的快取資料不一致。

因此需要每個 CPU 存取快取時遵循一定的協議,在讀寫資料時根據協議進行操作,共同來維護快取的一致性。這類協定有 MSI、MESI、MOSI、和 Dragon Protocol 等。

1.3. 處理器最佳化和指令重新排序

為了提升效能在CPU 和主記憶體之間增加了高速緩存,但在多執行緒並發場景可能會遇到緩存一致性問題。那還有沒有辦法進一步提升 CPU 的執行效率呢?答案是:處理器優化。

為了讓處理器內部的運算單元能夠最大化並充分利用,處理器會對輸入程式碼進行亂序執行處理,這就是處理器最佳化。

除了處理器會對程式碼進行最佳化處理,許多現代程式語言的編譯器也會做類似的最佳化,例如像 Java 的即時編譯器(JIT)會做指令重排序。
圖文詳解!什麼是Java記憶體模型

處理器最佳化其實也是重排序的一種類型,這裡總結一下,重排序可以分成三種:

  • 編譯器最佳化的重新排序。編譯器在不改變單執行緒程式語意放入前提下,可以重新安排語句的執行順序。
  • 指令層級並行的重新排序。現代處理器採用了指令層級並行技術來將多條指令重疊執行。如果不存在資料依賴性,處理器可以改變語句對應機器指令的執行順序。
  • 記憶體系統的重新排序。由於處理器使用快取和讀寫緩衝區,這使得載入和儲存操作看起來可能是在亂序執行。

2. 並發程式設計的問題

上面講了一堆硬體相關的東西,有些同學可能會有點懵,繞了這麼大圈,這些東西跟Java 記憶體模型有啥關係嗎?不要急咱們慢慢往下看。

熟悉 Java 並發的同學肯定對這三個問題很熟悉:『可見性問題』、『原子性問題』、『有序性問題』。如果從更深層看這三個問題,其實就是上面講的『快取一致性』、『處理器優化』、『指令重新排序』造成的。

圖文詳解!什麼是Java記憶體模型
快取一致性問題其實就是可見性問題,處理器最佳化可能會造成原子性問題,指令重新排序會造成有序性問題,你看是不是都聯繫上了。

出了問題總是要解決的,那有什麼辦法呢?首先想到簡單粗暴的辦法,幹掉快取讓CPU 直接與主記憶體互動就解決了可見性問題,禁止處理器優化和指令重排序就解決了原子性和有序性問題,但這樣一夜回到解放前了,顯然不可取。

所以技術前輩們想到了在實體機器上定義出一套記憶體模型, 規範記憶體的讀寫操作。記憶體模型解決並發問題主要採用兩種方式:限制處理器最佳化使用記憶體屏障

3. Java 記憶體模型

同一套記憶體模型規範,不同語言在實作上可能會有些差異。接下來著重講一下 Java 記憶體模型實作原理。

3.1. Java 運行時記憶體區域與硬體記憶體的關係

了解JVM 的同學都知道,JVM 運行時記憶體區域是分片的,分為堆疊、堆等,其實這些都是JVM 定義的邏輯概念。在傳統的硬體記憶體架構中是沒有堆疊和堆這種概念。
圖文詳解!什麼是Java記憶體模型
從圖中可以看出堆疊和堆疊既存在於快取中又存在於主記憶體中,所以兩者並沒有很直接的關係。

3.2. Java 執行緒與主記憶體的關係

Java 記憶體模型是一種規範,定義了很多東西:

  • 所有的變數都儲存在主內存(Main Memory)中。
  • 每個執行緒都有一個私有的本地記憶體(Local Memory),在本地記憶體中儲存了該執行緒以讀取/寫入共享變數的拷貝副本。
  • 線程對變數的所有操作都必須在本地記憶體中進行,而不能直接讀取和寫入主記憶體。
  • 不同的執行緒之間無法直接存取對方本地記憶體中的變數。

看文字太無聊了,我又畫了一張圖:
圖文詳解!什麼是Java記憶體模型

#3.3. 線程間通訊

如果兩個線程都對一個共享變數進行操作,共享變數初始值為1,每個執行緒都變數進行加1,預期共享變數的值為3。在 JMM 規範下會有一系列的操作。
圖文詳解!什麼是Java記憶體模型
為了更好的控制主記憶體和本地記憶體的交互,Java 記憶體模型定義了八個操作來實現:

  • lock:鎖定。作用於主記憶體的變量,把一個變數標識為一條執行緒獨佔狀態。
  • unlock:解鎖。作用於主記憶體變量,把一個處於鎖定狀態的變數釋放出來,釋放後的變數才可以被其他執行緒鎖定。
  • read:讀取。作用於主記憶體變量,把一個變數值從主記憶體傳送到線程的工作記憶體中,以便隨後的load動作使用
  • load:載入。作用於工作記憶體的變量,它把read操作從主記憶體中得到的變數值放入工作記憶體的變數副本中。
  • use:使用。作用於工作記憶體的變量,把工作記憶體中的一個變數值傳遞給執行引擎,每當虛擬機器遇到一個需要使用變數的值的字節碼指令時將會執行這個操作。
  • assign:賦值。作用於工作記憶體的變量,它把一個從執行引擎接收到的值賦值給工作記憶體的變量,每當虛擬機器遇到一個給變量賦值的字節碼指令時執行這個操作。
  • store:儲存。作用於工作記憶體的變量,把工作記憶體中的一個變數的值傳送到主記憶體中,以便隨後的write的操作。
  • write:寫入。作用於主記憶體的變量,它把store運算從工作記憶體中一個變數的值傳送到主記憶體的變數。

注意:工作記憶體也就是本地記憶體的意思。

4. 有態度的總結

由於CPU 和主記憶體間存在數量級的速率差,想到了引入了多級高速緩存的傳統硬體記憶體架構來解決,多級高速緩存作為CPU 和主內間的緩衝提升了整體效能。解決了速率差的問題,卻又帶來了快取一致性問題。

資料同時存在於快取和主記憶體中,如果不加以規範勢必造成災難,因此在傳統機器上又抽像出了記憶體模型。

Java 語言在遵循記憶體模型的基礎上推出了JMM 規範,目的是解決由於多執行緒透過共享記憶體進行通訊時,存在的本機記憶體資料不一致、編譯器會對程式碼指令重排序、處理器會對程式碼亂序執行等帶來的問題。

為了更精確控制工作記憶體和主記憶體間的交互,JMM 也定義了八個操作:lock, unlock, read , load,use,assign, store, write

推薦學習:《java學習教學

以上是圖文詳解!什麼是Java記憶體模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:csdn.net。如有侵權,請聯絡admin@php.cn刪除