首頁  >  文章  >  Java  >  Java 垃圾回收機制

Java 垃圾回收機制

高洛峰
高洛峰原創
2017-02-27 15:28:371066瀏覽

 Java 垃圾回收機制詳解

乍一看,垃圾回收所做的事情應當恰如其名——尋找並清除垃圾。事實上卻恰恰相反。垃圾回收會追蹤所有仍在使用的對象,然後將剩餘的對象標記為垃圾。牢記了這一點之後,我們再來深入了解下這個被稱為「垃圾回收」的自動化記憶體回收在JVM中到底是如何實現的。

手動管理記憶體

在介紹現代版的垃圾回收之前,我們先來簡單地回顧下需要手動地明確分配及釋放記憶體的那些日子。如果你忘了去釋放內存,那麼這塊內存就無法重複使用了。這塊記憶體被佔有了卻沒被使用。這種場景稱為記憶體外洩。

下面是用C寫的一個手動管理記憶體的簡單例子:

int send_request() {
  size_t n = read_size();
  int *elements = malloc(n * sizeof(int));

  if(read_elements(n, elements) < n) {
    // elements not freed!
    return -1;
  }

  // …

  free(elements)
  return 0;
}

可以看到,你很容易就會忘了釋放記憶體。記憶體外洩曾經是個非常普遍的問題。你只能透過不斷地修復自己的程式碼來與它們進行抗爭。因此,需要有一種更優雅的方式來自動釋放無用內存,以便減少人為錯誤的可能性。這種自動化過程又被稱為垃圾回收(簡稱GC)。

智慧型指標

自動垃圾回收早期的一種實作便是參考計數。你知道每一個物件被引用了幾次,當計數器歸0的時候,這個物件就可以被安全地回收掉了。 C++的共享指標就是一個非常著名的例子:

int send_request() {
  size_t n = read_size();
  stared_ptr<vector<int>> elements 
       = make_shared<vector<int>&gt();

  if(read_elements(n, elements) < n) {
    return -1;
  }

  return 0;
}

#我們所使用的sharedptr會記錄這個物件被引用的次數。如果你將它傳遞給別人則計數加一,當它離開了作用域後便會減一。一旦這個計數為0,sharedptr會自動地刪除底層對應的vector。當然這只是一個範例,因為也有讀者指出來了,這個在現實中是不太可能出現的,但作為演示是足夠了。

自動記憶體管理

在上面的C++程式碼中,我們還得明確地宣告我們需要使用記憶體管理。那如果所有的物件都採用這個機制會怎麼樣呢?那簡直就太方便了,這樣開發人員便不需要 考慮清理記憶體的事情了。運行時會自動知曉哪些記憶體不再使用了,然後釋放掉它。也就是說,它自動地回收了這些垃圾。第一代的垃圾回收器是1959年Lisp 引進的,這項技術迄今一直在持續演進。

 引用計數 

剛才我們用C++的共享指標所示範的想法可以應用到所有的物件上。許多語言比如說Perl, Python以及PHP,採用的都是這種方式。這個透過一張圖可以很容易說明:

綠色的雲代表的是程式中仍在使用的物件。從技術層面來說,這有點像是正在執行的某個方法裡面的局部變量,亦或是靜態變數之類的。不同程式語言的情況可能會不一樣,因此這並不是我們關注的重點。

藍色的圓圈代表的是記憶體中的對象,可以看到有多少對象引用了它們。灰色圓圈的物件是已經沒有任何人引用的了。因此,它們屬於垃圾對象,可以被垃圾回收器清理掉。

看起來還不錯吧?沒錯,不過這裡存在著一個重大的缺陷。很容易會出現一些孤立的環,它們中的物件都不在任何域內,但彼此卻互相引用導致引用數不為0。下面便是一個例子:

看到了吧,紅色部分其實就是應用程式不再使用的垃圾物件。由於引用計數的缺陷,因此會存在記憶體洩漏。

有幾種方法可以解決這個問題,比如說使用特殊的「弱」引用,或是使用一個特殊的演算法來回收循環引用。先前提到的Perl,Python以及PHP等語言,都是使用類似的方法回收循環引用的,不過這已經超出本文所述的範圍了。我們準備詳細介紹下JVM所採用的方法。

標記刪除

首先,JVM對於物件可達性的定義要明確一些。它可不像前面那樣用綠色的雲便含糊了事的,而是有著非常明確及具體的垃圾回收根物件(Garbage Collection Roots)的定義:

  • 局部變數

  • 活動執行緒

  • # 靜態欄位

  • JNI引用


  • #其它(後面將會討論到)

  • JVM透過標記刪除的演算法來記錄所有可達(存活)對象,同時確保不可達對象的那些內存能夠被重複使用。這包含兩個步驟:

    ######標記是指遍歷所有可達對象,然後在本機記憶體中記錄這些物件的資訊############刪除會確保不可達物件的記憶體位址可以在下一次記憶體分配中使用。 ######

JVM中的不同GC演算法,比如說​​Parallel Scavenge,Parallel Mark+Copy, CMS都是這一演算法的不同實現,只是各階段略有不同而已,從概念上來講仍然是對應著上面所說的兩個步驟。

這種實作最重要的就是不會再出現洩漏的物件環了:

缺點就是應用程式的執行緒需要被暫停才能完成回收,如果引用一直在變的話你是無法進行計數的。這個應用程式被暫停以便JVM可以收拾家務的情況又被稱為Stop The World pause(STW)。這種暫停被觸發的可能性很多,不過垃圾回收應該是最常見的一種。

感謝閱讀,希望能幫助大家,謝謝大家對本站的支持!

更多Java 垃圾回收機制相關文章請關注PHP中文網!


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn