首頁  >  文章  >  Java  >  理解Java垃圾回收機制

理解Java垃圾回收機制

WBOY
WBOY轉載
2023-04-24 14:10:07968瀏覽

在說記憶集和卡片表之前,先跟大家介紹一下跨世代引用的問題。

理解Java垃圾回收機制

假如要現在進行一次只局限於新生代區域內的收集(Minor GC),但新生代的實例物件1在老年代中被引用,為了找出該區域(新生代)中所有的存活對象,不得不在固定的GC Roots之外,再額外遍歷整個老年代中所有對象來確保可達性分析結果的正確性,反過來也是一樣。遍歷整個老年代所有物件的方案雖然理論上可行,但無疑會為記憶體回收帶來很大的效能負擔。

事實上不只是新生代、老年代之間才有跨代引用的問題,所有涉及部分區域收集(Partial GC)行為的垃圾收集器,典型的如G1、ZGC和Shenandoah收集器,都會面臨相同的問題。

那麼如何才能解決跨代引用呢?

首先,跨代引用相對於同代引用來說僅佔極少數。原因是跨世代引用的對象應該傾向於同時生存或同時死亡的(舉個:如果某個新生代對象存在跨代引用,由於老年代對象難以消亡,該引用會使得新生代對像在收集時同樣得以存活,進而在年齡增長之後晉升到老年代中,這時跨代引用也隨即被消除了)。

依據上面說所,就不應再為了少量的跨代引用去掃描整個老年代,也不必浪費空間專門記錄每一個對像是否存在及存在哪些跨代引用,只需在新生代上建立一個全局的資料結構(該結構被稱為“記憶集”,Remembered Set),這個結構把老年代劃分成若干小塊,標識出老年代的哪一塊內存會存在跨代引用。此後當發生Minor GC時,只有包含了跨代引用的小塊記憶體裡的物件才會被加入到GCRoots進行掃描。雖然這種方法需要在物件改變引用關係(如將自己或某個屬性賦值)時維護記錄資料的正確性,會增加一些運行時的開銷,但比起收集時掃描整個老年代來說仍然是划算的。

下面就來介紹一下這個全域的資料結構記憶集。

記憶集

記憶集是一種用於記錄從非收集區域指向收集區域的指標集合的抽象資料結構。如果我們不考慮效率和成本的話,最簡單的實作可以用非收集區域中所有含跨代引用的物件數組來實現這個資料結構,如下面程式碼所示:

//以对象指针来实现记忆集的伪代码
Class RememberedSet {
	Object[] set[OBJECT_INTERGENERATIONAL_REFERENCE_SIZE]; 
}

這種記錄全部含跨世代引用物件的實作方案,無論是空間佔用或維護成本都相當高昂。而在垃圾收集的場景中,收集器只需要透過記憶集判斷某一塊非收集區域是否存在有指向了收集區域的指針就可以了,並不需要了解這些跨代指針的全部細節。那設計者在實現記憶集的時候,便可以選擇更粗獷的記錄粒度來節省記憶集的儲存和維護成本。以下列舉了一些可供選擇(當然也可以選擇這個範圍以外的)的記錄精度:

  • 字長精度:每個記錄精確到一個機器字長(就是處理器的尋址位數,如常見的32位或64位,這個精確度決定了機器存取實體記憶體位址的指標長度),該字包含跨代指標。

  • 物件精確度:每個記錄精確到一個對象,該對象裡有欄位含有跨代指針。

  • 卡片精確度:每個記錄精確到一塊記憶體區域,該區域內有物件含有跨代指標。

上面的,第三種「卡片精度」所指的是用一種稱為「卡片表」(Card Table)的方式去實作記憶集,這也是目前最常用的記憶集的實現形式。

卡片表和記憶集又有什麼關係呢?

前面介紹記憶集的時候提到 記憶集其實是一種"抽象」的資料結構,抽象的意思是只定義了記憶集的行為意圖,並沒有定義其行為的具體實現。卡表就是記憶集的一種具體實現,它定義了記憶集的記錄精度、與堆內存的映射關係等。關於記憶集與卡片表的關係,可以依照Java中Map與HashMap的關係來類比理解(即介面與實作類別來的關係)。

下面來詳細說一下記憶集的具體實現卡表

卡表

#卡表是使用一個位元組數組CARD_TABLE[] 實現,每個元素對應其標識的記憶體區域一塊特定大小的記憶體區塊,每個記憶體區塊稱為卡頁,hotspot使用的卡頁是2^9大小即512位元組。如下圖所示

理解Java垃圾回收機制

這樣我們就可以把某個區域按照卡頁進行劃分,假如我們現在要對新生代區域進行垃圾回收,那麼就可以把老年代區域看成是一個卡頁一個卡頁劃分好的,如下圖。

理解Java垃圾回收機制

如圖所示,因為cardpage1中存在指向新生代的跨代引用,所以對應卡表的第一個位置為1,表示該page區域存在跨代應用的對象。

  • 卡片表角度:因為page1中存在跨代飲用的對象,所以卡片表對應的第一個位置記為1,表示page1這個元素變髒。

  • 記憶體回收角度:因為卡片表的第一個位置為1,表示該page區域存在跨代應用的對象,垃圾回收的時候需要掃描該區域。

一個卡片頁的記憶體中通常包含不只一個對象,只要卡片頁內有一個(或更多)物件的欄位存在著跨代指針,那就將對應卡表的數組元素的值標識為1,稱為這個元素變髒(Dirty),沒有則標識為0。在垃圾收集發生時,只要篩選出卡表中變髒的元素,就能輕易得出哪些卡頁內存塊中包含跨代指針,把它們加入GC Roots中一併掃描。這樣就不需要掃描整個老年代大幅減少GC Roots的掃描範圍。 

以上是理解Java垃圾回收機制的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:yisu.com。如有侵權,請聯絡admin@php.cn刪除