首頁  >  文章  >  Java  >  JVM記憶體管理------垃圾蒐集器精解(讓你在垃圾蒐集器的世界裡耍的游刃有餘)

JVM記憶體管理------垃圾蒐集器精解(讓你在垃圾蒐集器的世界裡耍的游刃有餘)

黄舟
黄舟原創
2016-12-28 15:51:341118瀏覽

引言

在上一章我們已經探討過hotspot上垃圾蒐集器的實現,一共有六種實現六種組合。本次LZ與各位一起探討下這六種蒐集器各自的威力以及組合的威力如何。
為了方便各位的觀看與對比,LZ決定採用當初寫設計模式時使用的方式,針對某些蒐集器,分幾個維度去解釋這些蒐集器。

client模式與server模式

在介紹本章內容之前,要說一下JVM的兩種模式,一種是client模式,一種是server模式。我們平常開發使用的模式預設是client模式,也可以使用命令列參數-server強制開啟server模式,兩者最大的差別在於在server模式下JVM做了很多最佳化。
server模式下的JAVA應用程式啟動較慢,不過由於server模式下JVM所做的最佳化,在程式長時間運行下,運行速度將會越來越快。相反,client模式下的JAVA應用程式雖然啟動快,但不適合長時間運行,若是運行時間較長的話,則會在效能上明顯低於server模式。

蒐集器詳解

以下我們先探討一下單一垃圾蒐集器的相關內容,最後我們再簡單的談一下組合之後,各個組合的特點。

Serial Garbage Collector

演算法:採用複製演算法
記憶體區域:針對新生代設計
執行方式:單線程、串列
執行過程:當新生代記憶體不夠用時,先暫停全部用戶程序,然後開啟一條GC執行緒使用複製演算法對垃圾進行回收,這一過程中可能會有一些物件提升到年老代
特點:由於單執行緒運行,且整個GC階段都要暫停使用者程序,因此會造成應用程式停頓時間較長,但對於小規模的程式來說,卻非常適合。
適用場景:平時的開發與偵錯程式使用,以及桌面應用互動程式。
開啟參數:-XX:+UseSerialGC(client模式預設值) 

Serial Old Garbage Collector

這裡針對serial old蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,區別是它蒐集器不再列舉各個維度的特點,因為它與serial蒐集器是一樣的,差別是它蒐集器不再列舉是針對年老代而設計的,因此採用標記/整理演算法。對於其餘的維度特點,serial old與serial蒐集器一模一樣。

ParNew Garbage Collector

演算法:採用複製演算法
記憶體區域:針對新生代設計
執行方式:多執行緒、並行
執行過程:當新生代記憶體不夠用時,先暫停全部使用者程序,然後開啟若干GC執行緒使用複製演算法並行進行垃圾回收,這一過程中可能會有一些物件提升到年老代
特點:採用多執行緒並行運行,因此會對系統的核心處理器數目比較敏感,至少需要多於一個的處理器,有幾個處理器就會開幾個執行緒(不過執行緒數是可以使用參數-XX:ParallelGCThreads=控制的),因此只適合多核心多處理器的系統。儘管整個GC階段還是要暫停使用者程序,但多執行緒並行處理並不會造成太長的停頓時間。因此就吞吐量來說,ParNew要大於serial,在處理器越多的時候,效果越明顯。但這並非絕對,對於單一處理器來說,由於並行執行的開銷(例如同步),ParNew的效能將會低於serial蒐集器。不只是單一處理器的時候,如果在容量較小的堆上,甚至在兩個處理器的情況下,ParNew的性能都並非一定可以高過serial。
適用場景:在中到大型的堆上,且系統處理器至少多於一個的情況
開啟參數:-XX:+UseParNewGC

Parallel Scavenge Garbage Collector

這個蒐集器與ParNew幾乎一模一樣,都是針對 Garbage Collector

這個蒐集器與ParNew幾乎一模一樣,都是針對 Garbage Collector

這個蒐集器與ParNew幾乎一模一樣,都是針對新生代設計,採用複製演算法的平行蒐集器。它與ParNew最大的不同就是可設定的參數不一樣,它可以讓我們更精確的控制GC停頓時間以及吞吐量。 🎜parallel scavenge蒐集器提供參數主要包括控制最大的停頓時間(使用-XX:MaxGCPauseMillis=),以及控制吞吐量(使用-XX:GCTimeRatio=)。由此可以看出,parallel scavenge就是為了提供吞吐量控制的收集器。 🎜不過千萬不要以為把最大停頓時間調的越小越好,或者吞吐量越大越好,在使用parallel scavenge蒐集器時,主要有三個性能指標,最大停頓時間、吞吐量以及新生代區域的最小值。 🎜parallel scavenge蒐集器具有相應的調節策略,它將優先滿足最大停頓時間的目標,次之是吞吐量,最後才是新生代區域的最小值。 🎜因此,如果將最大停頓時間調的過小,將會犧牲整體的吞吐量以及新生代大小來滿足你的私慾。手心手背都是肉,我們最好不要這麼乾。不過parallel scavenge有一個參數可以讓parallel scavenge蒐集器全權接手內存區域大小的調節,這其中還包括了晉升為年老代(可使用-XX:MaxTenuringThreshold=n調節)的年齡,也就是使用-XX: UseAdaptiveSizePolicy開啟記憶體區域大小自適應策略。
parallel scavenge蒐集器可使用參數-XX:+UseParallelGC開啟,同時它也是server模式下預設的新生代蒐集器。

Parallel Old Garbage Collector

Parallel Old與ParNew或Parallel Scavenge的關係就好似serial與serial old一樣,相互之間的區別並不大,只不過parallel old是針對年老代設計的並行蒐集器而已,因此它採用標記/整理演算法。
Parallel Old蒐集器還有一個重要的意義就是,它是除了serial old以外唯一一個可以與parallel scavenge搭配工作的年老代蒐集器,因此為了避免serial old影響parallel scavenge可控制吞吐量的名聲,parallel old就作為了parallel scavenge真正意義上的搭檔。
它可以使用參數-XX:-UseParallelOldGC開啟,不過在JDK6以後,它也是在開啟parallel scavenge之後預設的年老代蒐集器。

Concurrent Mark Sweep Garbage Collector

concurrent mark sweep(以下簡稱CMS)蒐集器是唯一一個真正意義上實現了應用程式與GC線程一起工作(一起是針對客戶而言,而不一定是真正的一起,有可能是快速交替)的蒐集器。
CMS是針對年長世代設計的蒐集器,並採用標記/清除演算法,它也是唯一一個在年老代採用標記/清除演算法的蒐集器。
採用標記/清除演算法是因為它特殊的處理方式所造成的,它的處理分為四個階段。
1、初始標記:需要暫停應用程序,快速標記存活對象。
2、並發標記:恢復應用程序,並發跟踪GC Roots。
3、重新標記:需要暫停應用程序,重新標記追蹤遺漏的物件。
4、並發清除:恢復應用程序,並發清除未標記的垃圾物件。
它比原來的標記/清除演算法複雜了點,主要表現在並發標記和並發清除這兩個階段,而這兩個階段也是整個GC階段中耗時最長的階段,不過由於這兩個階段皆是與應用程式並發執行的,因此CMS蒐集器造成的停頓時間是非常短暫的。這點還是比較好理解的。
不過它的缺點也是要簡單提一下的,主要有以下幾點。

1、由於GC執行緒與應用程式並發執行時會搶先CPU資源,因此會造成整體的吞吐量下降。也就是說,從吞吐量的指標上來說,CMS蒐集器是要弱於parallel scavenge蒐集器的。 LZ這裡從oracle官網上摘錄下一段關於CMS的描述,裡面提到CMS效能與CPU個數的關係。
Since at least one processor is utilized for garbage collection during the concurrent phases, the concurrent collector does not normally provide any benefit on a uniprocessor (single-core) machine. However, there or on a uniproces with only one or two processors; see incremental mode below for details.

LZ的英文很一般(四級都沒過,慚愧,0.0),不過在藉助工具的情況下也能大致翻譯出來這段話的意思,如下。
中文大意:由於在並發階段垃圾蒐集至少使用了一個處理器,因此在單處理器的情況下使用並發蒐集器,將得不到任何好處。不過,在單一或兩個處理器的系統上,有一種獨立的方式可以有效的達到低停頓的目的,詳情請參閱下方的增量模式(incremental mode)。
很明顯,oracle的文檔指出,在單處理器的情況下,並發蒐集器會因為搶佔處理器,而造成效能降低。最後給出了一種增量模式的處理方式,不過在《深入理解JAVA虛擬機器》一書中指出,增量模式已經被定義為不建議使用。由於LZ摘錄的這段官方介紹是基於JDK5.0的介紹,而《深入理解JAVA虛擬機》一書中則是指的JDK6.0的版本,因此LZ暫且猜測,增量模式是在JDK6.0發布的時候被廢棄了,不過這個廢棄的時間或者說版本其實已經不重要了。
2、標記/清除很大的一個缺點,那就是記憶體碎片的存在。因此JVM提供了-XX:+UseCMSCompactAtFullCollection參數用於在全域GC(full GC)後進行一次碎片整理的工作,由於每次全域GC後都進行碎片整理會較大的影響停頓時間,JVM又提供了參數-XX:CMSFullGCsBeforeCompaction去控制在幾次全域GC後會進行碎片整理。
3、CMS最後一個缺點涉及到一個術語---並發模式失敗(Concurrent Mode Failure)。對於這個術語,官方是這樣解釋的。
if the concurrent collector is unable to finish reclaiming the unreachable objects before the tenured generation fills up, or if an allocation cannot be satisfied with the available free space blocks in the ten geneat not the not the not, s​​id and the collat​​​​ion sad not the not, sat the le完成. application threads stopped.The inability to complete a collection concurrently is referred to as concurrent mode failure and indicates the need to adjust the concurrent collector parameters.
大意:如果並發老代搜尋)物件的回收,或年老代中有效的空閒記憶體空間無法滿足某一個記憶體的分配請求,此時應用程式會被暫停,並在此暫停期間開始垃圾回收,直到回收完成才會恢復應用程式。這種無法並發完成蒐集的情況就成為並發模式失敗(concurrent mode failure),而這種情況的發生也意味著我們需要調節並發蒐集器的參數了。
上面兩個情況感覺有點重複,不能滿足記憶體的分配請求不就是在年老代填滿之前,沒有完成物件回收造成的嗎?
這裡LZ個人的理解是,年老代填滿之前無法完成對象回收是指年老代在並發清除階段清除不及時,因此造成的空閒內存不足。而無法滿足記憶體的分配請求,則主要指的是新生代在提升到年老代時,由於年老代的記憶體碎片過多,導致一些分配由於沒有連續的記憶體無法滿足。
實際上,在並發模式失敗的情況下,serial old會作為備選蒐集器,進行一次全局GC(Full GC),因此serial old也算是CMS的「替補」。顯然,由於serial old的介入,會造成較大的停頓時間。
為了盡量避免並發模式失敗發生,我們可以調節-XX:CMSInitiatingOccupancyFraction=參數,去控制當年老代的內存佔用達到多少的時候(N%),便開啟並發蒐集器開始回收年老代。

組合的威力

上面我們已經簡單的介紹了各個蒐集器的特點,下面LZ與各位分享三個典型的組合,其餘三種組合一般不常用。

serial & serial old

這個組合是我們最常見的組合之一,也是client模式下的預設垃圾蒐集器組合,也可以使用參數-XX:+UseSerialGC強制開啟。
由於它實現相對簡單,沒有線程相關的額外開銷(主要指線程切換與同步),因此非常適合運行於客戶端PC的小型應用程序,或者桌面應用程序(比如swing編寫的用戶界面程序),以及我們平時的開發、調試、測試等。
上面三種情況都有共同的特點。
1、由於都是在PC上運行,因此配置一般不會太高,或者說處理器個數不會太多。
2、上面幾種情況的​​應用程式都不會運行太久。
3、規模不會太大,也就是說,堆相對較小,蒐集起來也比較快,停頓時間會比較短。

Parallel Scavenge & Parallel Old

這個組合我們並不常見,畢竟它不會出現在我們平時的開發當中,但是它卻是很多對吞吐量(throughout)要求較高或者對停頓時間(pause time)要求不高的應用程式的首選,並且這個組合是server模式下的預設組合(JDK6或JDK6之後)。當然,它也可以使用-XX:+UseParallelGC參數強制開啟。
該組合無論是新生代或年老代都採用並行蒐集,因此停頓時間較短,系統的整體吞吐量較高。它適用於一些需要長期運行且對吞吐量有一定要求的後台程式。
這些運行於背景的程式都有以下特點。
1、系統配置較高,通常情況下至少四核心(以目前的硬體等級為準)。
2、對吞吐量要求較高,或需要達到一定的量。
3、應用程式運行時間較長。
4、應用程式規模較大,一般是中到大型的堆。

ParNew & CMS(Serial Old作為替補)

這個組合與上面的平行組合一樣,在平時的開發當中都不常見,而它則是對相應時間(response time)要求較高的應用程式的首選。組合需要使用參數-XX:+UseConcMarkSweepGC開啟。
此組合在新生代採用平行蒐集器,因此新生代的GC速度會非常快,停頓時間很短。而年長的GC採用並發蒐集,大部分垃圾蒐集的時間裡,GC線程都是與應用程式並發執行的,因此造成的停頓時間依然很短。它適用於一些需要長期運行且對相應時間有一定要求的後台程式。
這些運行於後台的程序的特點與並行模式下的後台程序十分類似,不同的是第二點,採用ParNew & CMS組合的後台應用程序,一般都對相應時間有一定要求,最典型的就是我們的WEB應用程式。

結束語

本次LZ整理了各個蒐集器的特點與各個組合的特點,此外,還有剩下的三種組合LZ這裡沒有提到,原因是這三種組合都不是特別常用,或者可以說幾乎不用,因為這三個組合都給人一種四不像的感覺,而且效果也確實不好。
希望本文能為各位帶來一些幫助,感謝各位的收看。

 以上就是JVM記憶體管理------垃圾蒐集器精解(讓你在垃圾蒐集器的世界裡耍的游刃有餘)的內容,更多相關內容請關注PHP中文網(www.php.cn )!


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn