當(dāng)前位置：首頁 > 编程语言 > java >内容正文

java

Java基础 —— JVM内存模型与垃圾回收

發(fā)布時(shí)間：2023/12/13 java 39 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java基础 —— JVM内存模型与垃圾回收小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、概述
二、運(yùn)行時(shí)數(shù)據(jù)區(qū)
- 方法區(qū)
- 運(yùn)行時(shí)常量池
- 堆
- 棧
- 本地方法棧
- 程序計(jì)數(shù)器
三、對象訪問
四、垃圾回收
- 如何定義垃圾
- - 1、引用計(jì)數(shù)法
  - 2、可達(dá)性分析
- 垃圾回收方法
- - 1、Mark-Sweep標(biāo)記-清除算法
  - 2、Copying復(fù)制算法
  - 3、Mark-Compact標(biāo)記-整理算法
  - 4、Generational Collection 分代收集
- 垃圾收集器
- - 1、Serial收集器
  - 2、ParNew收集器
  - 3、Parallel Scavenge收集器
  - 4、并發(fā)標(biāo)記清除（Concurrent Mark Sweep Collector, CMS）收集器

一、概述

對于從事C和C++程序開發(fā)的開發(fā)人員來說，在內(nèi)存管理領(lǐng)域，他們既是擁有最高權(quán)力的皇帝，又是從事最基礎(chǔ)工作的勞動人民—既擁有每一個對象的“所有權(quán)”，又擔(dān)負(fù)著每一個對象生命開始到終結(jié)的維護(hù)責(zé)任。

對于Java程序員來說，在虛擬機(jī)的自動內(nèi)存管理機(jī)制的幫助下，不再需要為每一個new操作去寫配對的delete/free代碼，而且不容易出現(xiàn)內(nèi)存泄漏和內(nèi)存溢出問題，看起來由虛擬機(jī)管理內(nèi)存一切都很美好。不過，也正是因?yàn)镴ava程序員把內(nèi)存控制的權(quán)力交給了Java虛擬機(jī)，一旦出現(xiàn)內(nèi)存泄漏和溢出方面的問題，如果不了解虛擬機(jī)是怎樣使用內(nèi)存的，那排查錯誤將會成為一項(xiàng)異常艱難的工作。

二、運(yùn)行時(shí)數(shù)據(jù)區(qū)

Java虛擬機(jī)在執(zhí)行Java程序的過程中會把它所管理的內(nèi)存劃分為若干個不同的數(shù)據(jù)區(qū)域。這些區(qū)域都有各自的用途，以及創(chuàng)建和銷毀的時(shí)間，有的區(qū)域隨著虛擬機(jī)進(jìn)程的啟動而存在，有些區(qū)域則是依賴用戶線程的啟動和結(jié)束而建立和銷毀。根據(jù)《Java虛擬機(jī)規(guī)范（第2版）》的規(guī)定，Java虛擬機(jī)所管理的內(nèi)存將會包括以下幾個運(yùn)行時(shí)數(shù)據(jù)區(qū)域，如下圖所示：

方法區(qū)

方法區(qū)（Method Area）與Java堆一樣，是各個線程共享的內(nèi)存區(qū)域，它用于存儲已被虛擬機(jī)加載的類信息、常量、靜態(tài)變量、即時(shí)編譯器編譯后的代碼等數(shù)據(jù)。雖然Java虛擬機(jī)規(guī)范把方法區(qū)描述為堆的一個邏輯部分，但是它卻有一個別名叫做Non-Heap（非堆），目的應(yīng)該是與Java堆區(qū)分開來。

對于習(xí)慣在HotSpot虛擬機(jī)上開發(fā)和部署程序的開發(fā)者來說，很多人愿意把方法區(qū)稱為“永久代”（Permanent Generation），本質(zhì)上兩者并不等價(jià)，僅僅是因?yàn)镠otSpot虛擬機(jī)的設(shè)計(jì)團(tuán)隊(duì)選擇把GC分代收集擴(kuò)展至方法區(qū)，或者說使用永久代來實(shí)現(xiàn)方法區(qū)而已。對于其他虛擬機(jī)（如BEA JRockit、IBM J9等）來說是不存在永久代的概念的。即使是HotSpot虛擬機(jī)本身，根據(jù)官方發(fā)布的路線圖信息，現(xiàn)在也有放棄永久代并“搬家”至Native Memory來實(shí)現(xiàn)方法區(qū)的規(guī)劃了。

Java虛擬機(jī)規(guī)范對這個區(qū)域的限制非常寬松，除了和Java堆一樣不需要連續(xù)的內(nèi)存和可以選擇固定大小或者可擴(kuò)展外，還可以選擇不實(shí)現(xiàn)垃圾收集。相對而言，垃圾收集行為在這個區(qū)域是比較少出現(xiàn)的，但并非數(shù)據(jù)進(jìn)入了方法區(qū)就如永久代的名字一樣“永久”存在了。這個區(qū)域的內(nèi)存回收目標(biāo)主要是針對常量池的回收和對類型的卸載，一般來說這個區(qū)域的回收“成績”比較難以令人滿意，尤其是類型的卸載，條件相當(dāng)苛刻，但是這部分區(qū)域的回收確實(shí)是有必要的。在Sun公司的BUG列表中，

曾出現(xiàn)過的若干個嚴(yán)重的BUG就是由于低版本的HotSpot虛擬機(jī)對此區(qū)域未完全回收而導(dǎo)致內(nèi)存泄漏。根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定，當(dāng)方法區(qū)無法滿足內(nèi)存分配需求時(shí)，將拋出OutOfMemoryError異常。

運(yùn)行時(shí)常量池

運(yùn)行時(shí)常量池（Runtime Constant Pool）是方法區(qū)的一部分。Class文件中除了有類的版本、字段、方法、接口描述等信息外，還有一項(xiàng)信息是常量池（Constant Pool Table），用于存放編譯期生成的各種字面量和符號引用，這部分內(nèi)容將在類加載后存放到方法區(qū)的運(yùn)行時(shí)常量池中。 Java虛擬機(jī)對Class文件的每一部分（自然也包括常量池）的格式都有嚴(yán)格的規(guī)定，每一個字節(jié)用于存儲哪種數(shù)據(jù)都必須符合規(guī)范上的要求，這樣才會被虛擬機(jī)認(rèn)可、裝載和執(zhí)行。但對于運(yùn)行時(shí)常量池，Java虛擬機(jī)規(guī)范沒有做任何細(xì)節(jié)的要求，不同的提供商實(shí)現(xiàn)的虛擬機(jī)可以按照自己的需要來實(shí)現(xiàn)這個內(nèi)存區(qū)域。不過，一般來說，除了保存Class文件中描述的符號引用外，還會把翻譯出來的直接引用也存儲在運(yùn)行時(shí)常量池中。運(yùn)行時(shí)常量池相對于Class文件常量池的另外一個重要特征是具備動態(tài)性，Java語言并不要求常量一定只能在編譯期產(chǎn)生，也就是并非預(yù)置入Class文件中常量池的內(nèi)容才能進(jìn)入方法區(qū)運(yùn)行時(shí)常量池，運(yùn)行期間也可能將新的常量放入池中，這種特性被開發(fā)人員利用得比較多的便是String類的intern()方法。既然運(yùn)行時(shí)常量池是方法區(qū)的一部分，自然會受到方法區(qū)內(nèi)存的限制，當(dāng)常量池?zé)o法再申請到內(nèi)存時(shí)會拋出OutOfMemoryError異常。

堆

對于大多數(shù)應(yīng)用來說，Java堆（Java Heap）是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java堆是被所有線程共享的一塊內(nèi)存區(qū)域，在虛擬機(jī)啟動時(shí)創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對象實(shí)例，幾乎所有的對象實(shí)例都在這里分配內(nèi)存。這一點(diǎn)在Java虛擬機(jī)規(guī)范中的描述是：所有的對象實(shí)例以及數(shù)組都要在堆上分配，但是隨著JIT編譯器的發(fā)展與逃逸分析技術(shù)的逐漸成熟，棧上分配、標(biāo)量替換優(yōu)化技術(shù)將會導(dǎo)致一些微妙的變化發(fā)生，所有的對象都分配在堆上也漸漸變得不是那么“絕對”了。

Java堆是垃圾收集器管理的主要區(qū)域，因此很多時(shí)候也被稱做“GC堆”（Garbage Collected Heap，幸好國內(nèi)沒翻譯成“垃圾堆”）。如果從內(nèi)存回收的角度看，由于現(xiàn)在收集器基本都是采用的 分代收集算法 ，所以Java堆中還可以細(xì)分為： 新生代和老年代；再細(xì)致一點(diǎn)的有 Eden空間、From Survivor空間、To Survivor空間 等。如果從內(nèi)存分配的角度看，線程共享的Java堆中可能劃分出多個線程私有的分配緩沖區(qū)（Thread Local Allocation Buffer，TLAB）。不過，無論如何劃分，都與存放內(nèi)容無關(guān)，無論哪個區(qū)域，存儲的都仍然是對象實(shí)例，進(jìn)一步劃分的目的是為了更好地回收內(nèi)存，或者更快地分配內(nèi)存。在本章中，我們僅僅針對內(nèi)存區(qū)域的作用進(jìn)行討論，Java堆中的上述各個區(qū)域的分配和回收等細(xì)節(jié)將會是下一章的主題。

根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定，Java堆可以處于物理上不連續(xù)的內(nèi)存空間中，只要邏輯上是連續(xù)的即可，就像我們的磁盤空間一樣。在實(shí)現(xiàn)時(shí)，既可以實(shí)現(xiàn)成固定大小的，也可以是可擴(kuò)展的，不過當(dāng)前主流的虛擬機(jī)都是按照可擴(kuò)展來實(shí)現(xiàn)的（通過-Xmx和-Xms控制）。如果在堆中沒有內(nèi)存完成實(shí)例分配，并且堆也無法再擴(kuò)展時(shí)，將會拋出OutOfMemoryError異常。

棧

Java虛擬機(jī)棧（Java Virtual Machine Stacks）是線程私有的，它的生命周期與線程相同。虛擬機(jī)棧描述的是Java方法執(zhí)行的內(nèi)存模型：每個方法被執(zhí)行的時(shí)候都會同時(shí)創(chuàng)建一個棧幀（Stack Frame）用于存儲局部變量表、操作棧、動態(tài)鏈接、方法出口等信息。每一個方法被調(diào)用直至執(zhí)行完成的過程，就對應(yīng)著一個棧幀在虛擬機(jī)棧中從入棧到出棧的過程。

經(jīng)常有人把Java內(nèi)存區(qū)分為堆內(nèi)存（Heap）和棧內(nèi)存（Stack），這種分法比較粗糙，Java內(nèi)存區(qū)域的劃分實(shí)際上遠(yuǎn)比這復(fù)雜。這種劃分方式的流行只能說明大多數(shù)程序員最關(guān)注的、與對象內(nèi)存分配關(guān)系最密切的內(nèi)存區(qū)域是這兩塊。其中所指的“堆”就是Java堆，而所指的“棧”就是現(xiàn)在講的虛擬機(jī)棧，或者說是虛擬機(jī)棧中的局部變量表部分。

局部變量表存放了編譯期可知的各種基本數(shù)據(jù)類型（boolean、byte、char、short、int、float、long、double）、對象引用（reference類型），它不等同于對象本身，根據(jù)不同的虛擬機(jī)實(shí)現(xiàn)，它可能是一個指向?qū)ο笃鹗嫉刂返囊弥羔?#xff0c;也可能指向一個代表對象的句柄或者其他與此對象相關(guān)的位置）和returnAddress類型（指向了一條字節(jié)碼指令的地址）。

其中64位長度的long和double類型的數(shù)據(jù)會占用2個局部變量空間（Slot），其余的數(shù)據(jù)類型只占用1個。局部變量表所需的內(nèi)存空間在編譯期間完成分配，當(dāng)進(jìn)入一個方法時(shí)，這個方法需要在幀中分配多大的局部變量空間是完全確定的，在方法運(yùn)行期間不會改變局部變量表的大小。在Java虛擬機(jī)規(guī)范中，對這個區(qū)域規(guī)定了兩種異常狀況：如果線程請求的棧深度大于虛擬機(jī)所允許的深度，將拋出StackOverflowError異常；如果虛擬機(jī)棧可以動態(tài)擴(kuò)展（當(dāng)前大部分的Java虛擬機(jī)都可動態(tài)擴(kuò)展，只不過Java虛擬機(jī)規(guī)范中也允許固定長度的虛擬機(jī)棧），當(dāng)擴(kuò)展時(shí)無法申請到足夠的內(nèi)存時(shí)會拋出OutOfMemoryError異常。

本地方法棧

本地方法棧（Native Method Stacks）與虛擬機(jī)棧所發(fā)揮的作用是非常相似的，其區(qū)別不過是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法（也就是字節(jié)碼）服務(wù)，而本地方法棧則是為虛擬機(jī)使用到的Native方法服務(wù)。虛擬機(jī)規(guī)范中對本地方法棧中的方法使用的語言、使用方式與數(shù)據(jù)結(jié)構(gòu)并沒有強(qiáng)制規(guī)定，因此具體的虛擬機(jī)可以自由實(shí)現(xiàn)它。甚至有的虛擬機(jī)（譬如Sun HotSpot虛擬機(jī)）直接就把本地方法棧和虛擬機(jī)棧合二為一。與虛擬機(jī)棧一樣，本地方法棧區(qū)域也會拋出StackOverflowError和OutOfMemoryError異常。

程序計(jì)數(shù)器

程序計(jì)數(shù)器（Program Counter Register）是一塊較小的內(nèi)存空間，它的作用可以看做是當(dāng)前線程所執(zhí)行的字節(jié)碼的行號指示器。在虛擬機(jī)的概念模型里（僅是概念模型，各種虛擬機(jī)可能會通過一些更高效的方式去實(shí)現(xiàn)），字節(jié)碼解釋器工作時(shí)就是通過改變這個計(jì)數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令，分支、循環(huán)、跳轉(zhuǎn)、異常處理、線程恢復(fù)等基礎(chǔ)功能都需要依賴這個計(jì)數(shù)器來完成。由于Java虛擬機(jī)的多線程是通過線程輪流切換并分配處理器執(zhí)行時(shí)間的方式來實(shí)現(xiàn)的，在任何一個確定的時(shí)刻，一個處理器（對于多核處理器來說是一個內(nèi)核）只會執(zhí)行一條線程中的指令。因此，為了線程切換后能恢復(fù)到正確的執(zhí)行位置，每條線程都需要有一個獨(dú)立的程序計(jì)數(shù)器，各條線程之間的計(jì)數(shù)器互不影響，獨(dú)立存儲，我們稱這類內(nèi)存區(qū)域?yàn)椤熬€程私有”的內(nèi)存。如果線程正在執(zhí)行的是一個Java方法，這個計(jì)數(shù)器記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址；如果正在執(zhí)行的是Natvie方法，這個計(jì)數(shù)器值則為空（Undefined）。此內(nèi)存區(qū)域是唯一一個在Java虛擬機(jī)規(guī)范中沒有規(guī)定任何OutOfMemoryError情況的區(qū)域。

堆和棧分開設(shè)計(jì)是為什么呢？

棧存儲了處理邏輯，堆存儲了具體的數(shù)據(jù)，這樣隔離設(shè)計(jì)更為清晰；
堆與棧分離，使得堆可以被多個棧共享；
棧保存了上下文信息，因此只能向上增長，而堆是動態(tài)分配的。

總結(jié)：

名稱特征作用配置異常

棧區(qū)	線程私有，使用一段連續(xù)的內(nèi)存空間	存放局部變量表、操作棧、動態(tài)鏈接、方法出口	-XSs	StackOverflowError、OutOfMemoryError
堆	線程共享，生命周期與虛擬機(jī)相同	保存對象實(shí)例	-Xms -Xmx -Xmn	OutOfMemoryError
程序計(jì)數(shù)器	線程私有，占用內(nèi)存小	字節(jié)碼行號	無	無
方法區(qū)	線程共享	存儲類加載信息、常量、靜態(tài)變量等	-XX:PermSize -XX:MaxPermSize	OutOfMemoryError

三、對象訪問

介紹完Java虛擬機(jī)的運(yùn)行時(shí)數(shù)據(jù)區(qū)之后，我們就可以來探討一個問題：在Java語言中，對象訪問是如何進(jìn)行的？對象訪問在Java語言中無處不在，是最普通的程序行為，但即使是最簡單的訪問，也會卻涉及Java棧、Java堆、方法區(qū)這三個最重要內(nèi)存區(qū)域之間的關(guān)聯(lián)關(guān)系，如下面的這句代碼：

Object obj = new Object();

假設(shè)這句代碼出現(xiàn)在方法體中，那“Object obj”這部分的語義將會反映到Java棧的本地變量表中，作為一個reference類型數(shù)據(jù)出現(xiàn)。而“new Object()”這部分的語義將會反映到Java堆中，形成一塊存儲了Object類型所有實(shí)例數(shù)據(jù)值（Instance Data，對象中各個實(shí)例字段的數(shù)據(jù)）的結(jié)構(gòu)化內(nèi)存，根據(jù)具體類型以及虛擬機(jī)實(shí)現(xiàn)的對象內(nèi)存布局（Object Memory Layout）的不同，這塊內(nèi)存的長度是不固定的。另外，在Java堆中還必須包含能查找到此對象類型數(shù)據(jù)（如對象類型、父類、實(shí)現(xiàn)的接口、方法等）的地址信息，這些類型數(shù)據(jù)則存儲在方法區(qū)中。

由于reference類型在Java虛擬機(jī)規(guī)范里面只規(guī)定了一個指向?qū)ο蟮囊?#xff0c;并沒有定義這個引用應(yīng)該通過哪種方式去定位，以及訪問到Java堆中的對象的具體位置，因此不同虛擬機(jī)實(shí)現(xiàn)的對象訪問方式會有所不同，主流的訪問方式有兩種：使用句柄和直接指針。如果使用句柄訪問方式，Java堆中將會劃分出一塊內(nèi)存來作為句柄池，reference中存儲的就是對象的句柄地址，而句柄中包含了對象實(shí)例數(shù)據(jù)和類型數(shù)據(jù)各自的具體地址信息，如下圖所示：

如果使用的是直接指針訪問方式，Java 堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息，reference中直接存儲的就是對象地址，如下圖所示：

這兩種對象的訪問方式各有優(yōu)勢，使用句柄訪問方式的最大好處就是reference中存儲的是穩(wěn)定的句柄地址，在對象被移動（垃圾收集時(shí)移動對象是非常普遍的行為）時(shí)只會改變句柄中的實(shí)例數(shù)據(jù)指針，而reference本身不需要被修改。使用直接指針訪問方式的最大好處就是速度更快，它節(jié)省了一次指針定位的時(shí)間開銷，由于對象的訪問在Java中非常頻繁，因此這類開銷積少成多后也是一項(xiàng)非常可觀的執(zhí)行成本。就本書討論的主要虛擬機(jī)Sun HotSpot而言，它是使用第二種方式進(jìn)行對象訪問的，但從整個軟件開發(fā)的范圍來看，各種語言和框架使用句柄來訪問的情況也十分常見。

四、垃圾回收

如何定義垃圾

有兩種方式：引用計(jì)數(shù)（但是無法解決循環(huán)引用的問題）、可達(dá)性分析。

判斷對象可以回收的情況：

顯示的把某個引用置位NULL或者指向別的對象
局部引用指向的對象
弱引用關(guān)聯(lián)的對象

1、引用計(jì)數(shù)法

這個算法的實(shí)現(xiàn)是，給對象中添加一個引用計(jì)數(shù)器，每當(dāng)一個地方引用這個對象時(shí)，計(jì)數(shù)器值+1；當(dāng)引用失效時(shí)，計(jì)數(shù)器值-1。任何時(shí)刻計(jì)數(shù)值為0的對象就是不可能再被使用的。這種算法使用場景很多，但是，Java中卻沒有使用這種算法，因?yàn)?這種算法很難解決對象之間相互引用的情況 。

2、可達(dá)性分析

這個算法的基本思想是通過一系列稱為“GC Roots”的對象作為起始點(diǎn)，從這些節(jié)點(diǎn)向下搜索，搜索所走過的路徑稱為引用鏈，當(dāng)一個對象到GC Roots沒有任何引用鏈（即GC Roots到對象不可達(dá)）時(shí)，則證明此對象是不可用的。

那么問題又來了，如何選取GCRoots對象呢？在Java語言中，可以作為GCRoots的對象包括下面幾種：

虛擬機(jī)棧（棧幀中的局部變量區(qū)，也叫做局部變量表）中引用的對象。
方法區(qū)中的類靜態(tài)屬性引用的對象。
方法區(qū)中常量引用的對象。
本地方法棧中JNI(Native方法)引用的對象。

下面給出一個GCRoots的例子，如下圖，為GCRoots的引用鏈。

由圖可知，obj8、obj9、obj10都沒有到GCRoots對象的引用鏈，即便obj9和obj10之間有引用鏈，他們還是會被當(dāng)成垃圾處理，可以進(jìn)行回收。

垃圾回收方法

1、Mark-Sweep標(biāo)記-清除算法

這是最基礎(chǔ)的算法，標(biāo)記-清除算法就如同它的名字樣，分為“標(biāo)記”和“清除”兩個階段：首先標(biāo)記出所有需要回收的對象，標(biāo)記完成后統(tǒng)一回收所有被標(biāo)記的對象。這種算法的不足主要體現(xiàn)在效率和空間，從效率的角度講，標(biāo)記和清除兩個過程的效率都不高；從空間的角度講，標(biāo)記清除后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片，內(nèi)存碎片太多可能會導(dǎo)致以后程序運(yùn)行過程中在需要分配較大對象時(shí)，無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)一次垃圾收集動作。標(biāo)記-清除算法執(zhí)行過程如圖：

這種方法優(yōu)點(diǎn)：減少停頓時(shí)間，但是缺點(diǎn)：會造成內(nèi)存碎片。

2、Copying復(fù)制算法

復(fù)制算法是為了解決效率問題而出現(xiàn)的，它將可用的內(nèi)存分為兩塊，每次只用其中一塊，當(dāng)這一塊內(nèi)存用完了，就將還存活著的對象復(fù)制到另外一塊上面，然后再把已經(jīng)使用過的內(nèi)存空間一次性清理掉。這樣每次只需要對整個半?yún)^(qū)進(jìn)行內(nèi)存回收，內(nèi)存分配時(shí)也不需要考慮內(nèi)存碎片等復(fù)雜情況，只需要移動指針，按照順序分配即可。復(fù)制算法的執(zhí)行過程如圖：

不過這種算法有個缺點(diǎn)，內(nèi)存縮小為了原來的一半，這樣代價(jià)太高了 。現(xiàn)在的商用虛擬機(jī)都采用這種算法來 回收新生代，不過研究表明1:1的比例非常不科學(xué)，因此 新生代的內(nèi)存被劃分為一塊較大的Eden空間和兩塊較小的Survivor空間，每次使用Eden和其中一塊Survivor 。每次回收時(shí)，將Eden和Survivor中還存活著的對象一次性復(fù)制到另外一塊Survivor空間上，最后清理掉Eden和剛才用過的Survivor空間。HotSpot虛擬機(jī)默認(rèn)Eden區(qū)和Survivor區(qū)的比例為8:1，意思是每次新生代中可用內(nèi)存空間為整個新生代容量的90%。當(dāng)然，我們沒有辦法保證每次回收都只有不多于10%的對象存活，當(dāng)Survivor空間不夠用時(shí)，需要依賴?yán)夏甏M(jìn)行分配擔(dān)保（Handle Promotion）。

3、Mark-Compact標(biāo)記-整理算法

復(fù)制算法在對象存活率較高的場景下要進(jìn)行大量的復(fù)制操作，效率很低。萬一對象100%存活，那么需要有額外的空間進(jìn)行分配擔(dān)保。老年代都是不易被回收的對象，對象存活率高，因此一般不能直接選用復(fù)制算法。根據(jù)老年代的特點(diǎn)，有人提出了另外一種標(biāo)記-整理算法，過程與標(biāo)記-清除算法一樣，不過不是直接對可回收對象進(jìn)行清理，而是讓所有存活對象都向一端移動，然后直接清理掉邊界以外的內(nèi)存。標(biāo)記-整理算法的工作過程如圖：

這種方法可以解決內(nèi)存碎片問題，但是會增加停頓時(shí)間。

4、Generational Collection 分代收集

現(xiàn)代商用虛擬機(jī)基本都采用 分代收集算法來進(jìn)行垃圾回收 。這種算法沒什么特別的，無非是上面內(nèi)容的結(jié)合罷了，根據(jù)對象的生命周期的不同將內(nèi)存劃分為幾塊，然后根據(jù)各塊的特點(diǎn)采用最適當(dāng)?shù)氖占惴ā?strong>大批對象死去、少量對象存活的（新生代），使用復(fù)制算法，復(fù)制成本低；對象存活率高、沒有額外空間進(jìn)行分配擔(dān)保的（老年代），采用標(biāo)記-清理算法或者標(biāo)記-整理算法。

上面可以看到堆分成兩個個區(qū)域：

新生代(Young Generation)：用于存放新創(chuàng)建的對象，采用復(fù)制回收方法，如果在s0和s1之間復(fù)制一定次數(shù)后，轉(zhuǎn)移到年老代中。這里的垃圾回收叫做minor GC；
年老代(Old Generation)：這些對象垃圾回收的頻率較低，采用的標(biāo)記整理方法，這里的垃圾回收叫做 major GC。

這里可以詳細(xì)的說一下新生代復(fù)制回收的算法流程：

在新生代中，分為三個區(qū)：Eden，from survivor，to survior。

當(dāng)觸發(fā)minor GC時(shí)，會先把Eden中存活的對象復(fù)制到to Survivor中；
然后再看from survivor，如果次數(shù)達(dá)到年老代的標(biāo)準(zhǔn)，就復(fù)制到年老代中；如果沒有達(dá)到則復(fù)制到to survivor中，如果to survivor滿了，則復(fù)制到年老代中。
然后調(diào)換from survivor 和 to survivor的名字，保證每次to survivor都是空的等待對象復(fù)制到那里的。

垃圾收集器

垃圾收集器就是上面講的理論知識的具體實(shí)現(xiàn)了。不同虛擬機(jī)所提供的垃圾收集器可能會有很大差別，我們使用的是HotSpot，HotSpot這個虛擬機(jī)所包含的所有收集器如圖：

上圖展示了7種作用于不同分代的收集器，如果兩個收集器之間存在連線，那說明它們可以搭配使用。虛擬機(jī)所處的區(qū)域說明它是屬于新生代收集器還是老年代收集器。多說一句，我們必須明確一個觀點(diǎn)：沒有最好的垃圾收集器，更加沒有萬能的收集器，只能選擇對具體應(yīng)用最合適的收集器。這也是HotSpot為什么要實(shí)現(xiàn)這么多收集器的原因。OK，下面一個一個看一下收集器。

1、Serial收集器

最基本、發(fā)展歷史最久的收集器，這個收集器是一個采用復(fù)制算法的單線程的收集器，單線程一方面意味著它只會使用一個CPU或一條線程去完成垃圾收集工作，另一方面也意味著它進(jìn)行垃圾收集時(shí)必須暫停其他線程的所有工作，直到它收集結(jié)束為止。后者意味著，在用戶不可見的情況下要把用戶正常工作的線程全部停掉，這對很多應(yīng)用是難以接受的。不過實(shí)際上到目前為止，Serial收集器依然是虛擬機(jī)運(yùn)行在Client模式下的默認(rèn)新生代收集器，因?yàn)樗唵味咝АＳ脩糇烂鎽?yīng)用場景中，分配給虛擬機(jī)管理的內(nèi)存一般來說不會很大，收集幾十兆甚至一兩百兆的新生代停頓時(shí)間在幾十毫秒最多一百毫秒，只要不是頻繁發(fā)生，這點(diǎn)停頓是完全可以接受的。Serial收集器運(yùn)行過程如下圖所示：

說明：1. 需要STW（Stop The World），停頓時(shí)間長。2. 簡單高效，對于單個CPU環(huán)境而言，Serial收集器由于沒有線程交互開銷，可以獲取最高的單線程收集效率。

2、ParNew收集器

ParNew收集器其實(shí)就是Serial收集器的多線程版本，除了使用多條線程進(jìn)行垃圾收集外，其余行為和Serial收集器完全一樣，包括使用的也是復(fù)制算法。ParNew收集器除了多線程以外和Serial收集器并沒有太多創(chuàng)新的地方，但是它卻是Server模式下的虛擬機(jī)首選的新生代收集器，其中有一個很重要的和性能無關(guān)的原因是，除了Serial收集器外，目前只有它能與CMS收集器配合工作（看圖）。CMS收集器是一款幾乎可以認(rèn)為有劃時(shí)代意義的垃圾收集器，因?yàn)樗谝淮螌?shí)現(xiàn)了讓垃圾收集線程與用戶線程基本上同時(shí)工作。ParNew收集器在單CPU的環(huán)境中絕對不會有比Serial收集器更好的效果，甚至由于線程交互的開銷，該收集器在兩個CPU的環(huán)境中都不能百分之百保證可以超越Serial收集器。當(dāng)然，隨著可用CPU數(shù)量的增加，它對于GC時(shí)系統(tǒng)資源的有效利用還是很有好處的。它默認(rèn)開啟的收集線程數(shù)與CPU數(shù)量相同，在CPU數(shù)量非常多的情況下，可以使用-XX:ParallelGCThreads參數(shù)來限制垃圾收集的線程數(shù)。ParNew收集器運(yùn)行過程如下圖所示：

3、Parallel Scavenge收集器

Parallel Scavenge收集器也是一個新生代收集器，也是用復(fù)制算法的收集器，也是并行的多線程收集器，但是它的特點(diǎn)是它的關(guān)注點(diǎn)和其他收集器不同。介紹這個收集器主要還是介紹吞吐量的概念。CMS等收集器的關(guān)注點(diǎn)是盡可能縮短垃圾收集時(shí)用戶線程的停頓時(shí)間，而Parallel Scavenge收集器的目標(biāo)則是打到一個可控制的吞吐量。所謂吞吐量的意思就是CPU用于運(yùn)行用戶代碼時(shí)間與CPU總消耗時(shí)間的比值，即 吞吐量=運(yùn)行用戶代碼時(shí)間/（運(yùn)行用戶代碼時(shí)間+垃圾收集時(shí)間），虛擬機(jī)總運(yùn)行100分鐘，垃圾收集1分鐘，那吞吐量就是99%。另外，Parallel Scavenge收集器是虛擬機(jī)運(yùn)行在Server模式下的默認(rèn)垃圾收集器。

停頓時(shí)間短適合需要與用戶交互的程序，良好的響應(yīng)速度能提升用戶體驗(yàn)；高吞吐量則可以高效率利用CPU時(shí)間，盡快完成運(yùn)算任務(wù)，主要適合在后臺運(yùn)算而不需要太多交互的任務(wù)。

虛擬機(jī)提供了-XX:MaxGCPauseMillis和-XX:GCTimeRatio兩個參數(shù)來精確控制最大垃圾收集停頓時(shí)間和吞吐量大小。不過不要以為前者越小越好，GC停頓時(shí)間的縮短是以犧牲吞吐量和新生代空間換取的。由于與吞吐量關(guān)系密切，Parallel Scavenge收集器也被稱為“吞吐量優(yōu)先收集器”。Parallel Scavenge收集器有一個-XX:+UseAdaptiveSizePolicy參數(shù)，這是一個開關(guān)參數(shù)，這個參數(shù)打開之后，就不需要手動指定新生代大小、Eden區(qū)和Survivor參數(shù)等細(xì)節(jié)參數(shù)了，虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運(yùn)行情況手機(jī)性能監(jiān)控信息，動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時(shí)間或者最大的吞吐量。如果對于垃圾收集器運(yùn)作原理不太了解，以至于在優(yōu)化比較困難的時(shí)候，使用Parallel Scavenge收集器配合自適應(yīng)調(diào)節(jié)策略，把內(nèi)存管理的調(diào)優(yōu)任務(wù)交給虛擬機(jī)去完成將是一個不錯的選擇。

4、并發(fā)標(biāo)記清除（Concurrent Mark Sweep Collector, CMS）收集器

CMS（Conrrurent Mark Sweep）收集器是以獲取最短回收停頓時(shí)間為目標(biāo)的收集器。使用標(biāo)記 - 清除算法，收集過程分為如下四步：
（1）初始標(biāo)記，標(biāo)記GCRoots能直接關(guān)聯(lián)到的對象，時(shí)間很短。

（2）并發(fā)標(biāo)記，進(jìn)行GCRoots Tracing（可達(dá)性分析）過程，時(shí)間很長。

（3）重新標(biāo)記，修正并發(fā)標(biāo)記期間因用戶程序繼續(xù)運(yùn)作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄，時(shí)間較長。

（4）并發(fā)清除，回收內(nèi)存空間，時(shí)間很長。

其中，并發(fā)標(biāo)記與并發(fā)清除兩個階段耗時(shí)最長，但是可以與用戶線程并發(fā)執(zhí)行。運(yùn)行過程如下圖所示：

總結(jié)

以上是生活随笔為你收集整理的Java基础 —— JVM内存模型与垃圾回收的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：没有信用卡能查征信吗？查询方法和结果了解
下一篇： Java提高篇 —— Java三大特性之