深入理解JVM - ZGC垃圾收集器
如果下面的一些概念有些不清楚的可以先看深入理解JVM - 垃圾收集器和深入理解JVM - Shenandoah垃圾收集器。
ZGC(Z Garbage Collector)是一款由Oracle公司研發(fā)的,以低延遲為首要目標(biāo)的一款垃圾收集器。它是基于動態(tài)Region內(nèi)存布局,(暫時)不設(shè)年齡分代,使用了讀屏障、染色指針和內(nèi)存多重映射等技術(shù)來實現(xiàn)可并發(fā)的標(biāo)記-整理算法的收集器。在JDK 11新加入,還在實驗階段,主要特點是:回收TB級內(nèi)存(最大4T),停頓時間不超過10ms。
動態(tài)Region
ZGC的Region可以具有如圖所示的大、中、小三類容量:
- 小型Region(Small Region):容量固定為2MB,用于放置小于256KB的小對象。
- 中型Region(Medium Region):容量固定為32MB,用于放置大于等于256KB但小于4MB的對象。·
- 大型Region(Large Region):容量不固定,可以動態(tài)變化,但必須為2MB的整數(shù)倍,用于放置4MB或以上的大對象。每個大型Region中只會存放一個大對象,最小容量可低至4MB,所有大型Region可能小于中型Region。大型Region在ZGC的實現(xiàn)中是不會被重分配的,因為復(fù)制一個大對象的代價非常高昂。
染色指針技術(shù)
HotSpot虛擬機的標(biāo)記實現(xiàn)方案有如下幾種:
染色指針是一種直接將少量額外的信息存儲在指針上的技術(shù)。目前在Linux下64位的操作系統(tǒng)中高18位是不能用來尋址的,但是剩余的46為卻可以支持64T的空間,到目前為止我們幾乎還用不到這么多內(nèi)存。于是ZGC將46位中的高4位取出,用來存儲4個標(biāo)志位,剩余的42位可以支持4T的內(nèi)存,如圖所示:
- Linux下64位指針的高18位不能用來尋址,所有不能使用;
- Finalizable:表示是否只能通過finalize()方法才能被訪問到,其他途徑不行;
- Remapped:表示是否進入了重分配集(即被移動過);
- Marked1、Marked0:表示對象的三色標(biāo)記狀態(tài);
- 最后42用來存對象地址,最大支持4T;
三色標(biāo)記
在并發(fā)的可達性分析算法中我們使用三色標(biāo)記(Tri-color Marking)來標(biāo)記對象是否被收集器訪問過:
- 白色:表示對象尚未被垃圾收集器訪問過。顯然在可達性分析剛剛開始的階段,所有的對象都是白色的,若在分析結(jié)束的階段,仍然是白色的對象,即代表不可達。
- 黑色:表示對象已經(jīng)被垃圾收集器訪問過,且這個對象的所有引用都已經(jīng)掃描過。黑色的對象代表已經(jīng)掃描過,它是安全存活的,如果有其他對象引用指向了黑色對象,無須重新掃描一遍。黑色對象不可能直接(不經(jīng)過灰色對象)指向某個白色對象。
- 灰色:表示對象已經(jīng)被垃圾收集器訪問過,但這個對象上至少存在一個引用還沒有被掃描過。
可達性分析的掃描過程,其實就是一股以灰色為波峰的波紋從黑向白推進的過程,但是在并發(fā)的推進過程中會產(chǎn)生“對象消失”的問題,如圖:、
對象消失理論,只有同時滿足才會發(fā)生對象消失:
- 賦值器插入了一條或多條從黑色對象到白色對象的新引用;
- 賦值器刪除了全部從灰色對象到該白色對象的直接或間接引用;
要解決對象消失問題只需要破壞其中一條就行了,目前常用有兩種方案:
- 增量更新(Incremental Update):增量更新要破壞的是第一個條件,當(dāng)黑色對象插入新的指向白色對象的引用關(guān)系時,就將這個新插入的引用記錄下來,等并發(fā)掃描結(jié)束之后,再將這些記錄過的引用關(guān)系中的黑色對象為根,重新掃描一次。這可以簡化理解為,黑色對象一旦新插入了指向白色對象的引用之后,它就變回灰色對象了。
- 原始快照(Snapshot At TheBeginning,SATB):原始快照要破壞的是第二個條件,當(dāng)灰色對象要刪除指向白色對象的引用關(guān)系時,就將這個要刪除的引用記錄下來,在并發(fā)掃描結(jié)束之后,再將這些記錄過的引用關(guān)系中的灰色對象為根,重新掃描一次。這也可以簡化理解為,無論引用關(guān)系刪除與否,都會按照剛剛開始掃描那一刻的對象圖快照來進行搜索。
以上無論是對引用關(guān)系記錄的插入還是刪除,虛擬機的記錄操作都是通過寫屏障實現(xiàn)的。CMS是基于增量更新來做并發(fā)標(biāo)記的,G1、Shenandoah則是用原始快照來實現(xiàn)。
染色指針的三大優(yōu)勢
內(nèi)存多重映射
ZGC使用了內(nèi)存多重映射(Multi-Mapping)將多個不同的虛擬內(nèi)存地址映射到同一個物理內(nèi)存地址上,這是一種多對一映射,意味著ZGC在虛擬內(nèi)存中看到的地址空間要比實際的堆內(nèi)存容量來得更大。把染色指針中的標(biāo)志位看作是地址的分段符,那只要將這些不同的地址段都映射到同一個物理內(nèi)存空間,經(jīng)過多重映射轉(zhuǎn)換后,就可以使用染色指針正常進行尋址了,效果如圖:
ZGC的多重映射只是它采用染色指針技術(shù)的伴生產(chǎn)物
讀屏障
當(dāng)對象從堆中加載的時候,就會使用到讀屏障(Load Barrier)。這里使用讀屏障的主要作用就是檢查指針上的三色標(biāo)記位,根據(jù)標(biāo)記位判斷出對象是否被移動過,如果沒有可以直接訪問,如果移動過就需要進行“自愈”(對象訪問會變慢,但也只會有一次變慢),當(dāng)“自愈”完成后,后續(xù)訪問就不會變慢了。
讀寫屏障可以理解成對象訪問的“AOP”操作
ZGC運作過程
ZGC的運作過程大致可劃分為以下四個大的階段:
- 并發(fā)標(biāo)記(Concurrent Mark):與G1、Shenandoah一樣,并發(fā)標(biāo)記是遍歷對象圖做可達性分析的階段,它的初始標(biāo)記和最終標(biāo)記也會出現(xiàn)短暫的停頓,整個標(biāo)記階段只會更新染色指針中的Marked 0、Marked 1標(biāo)志位。
- 并發(fā)預(yù)備重分配(Concurrent Prepare for Relocate):這個階段需要根據(jù)特定的查詢條件統(tǒng)計得出本次收集過程要清理哪些Region,將這些Region組成重分配集(Relocation Set)。ZGC每次回收都會掃描所有的Region,用范圍更大的掃描成本換取省去G1中記憶集的維護成本。
- 并發(fā)重分配(Concurrent Relocate):重分配是ZGC執(zhí)行過程中的核心階段,這個過程要把重分配集中的存活對象復(fù)制到新的Region上,并為重分配集中的每個Region維護一個轉(zhuǎn)發(fā)表(Forward Table),記錄從舊對象到新對象的轉(zhuǎn)向關(guān)系。ZGC收集器能僅從引用上就明確得知一個對象是否處于重分配集之中,如果用戶線程此時并發(fā)訪問了位于重分配集中的對象,這次訪問將會被預(yù)置的內(nèi)存屏障所截獲,然后立即根據(jù)Region上的轉(zhuǎn)發(fā)表記錄將訪問轉(zhuǎn)發(fā)到新復(fù)制的對象上,并同時修正更新該引用的值,使其直接指向新對象,ZGC將這種行為稱為指針的“自愈”(Self-Healing)能力。
ZGC的染色指針因為“自愈”(Self-Healing)能力,所以只有第一次訪問舊對象會變慢,而Shenandoah的Brooks轉(zhuǎn)發(fā)指針是每次都會變慢。
一旦重分配集中某個Region的存活對象都復(fù)制完畢后,這個Region就可以立即釋放用于新對象的分配,但是轉(zhuǎn)發(fā)表還得留著不能釋放掉,因為可能還有訪問在使用這個轉(zhuǎn)發(fā)表。
- 并發(fā)重映射(Concurrent Remap):重映射所做的就是修正整個堆中指向重分配集中舊對象的所有引用,但是ZGC中對象引用存在“自愈”功能,所以這個重映射操作并不是很迫切。ZGC很巧妙地把并發(fā)重映射階段要做的工作,合并到了下一次垃圾收集循環(huán)中的并發(fā)標(biāo)記階段里去完成,反正它們都是要遍歷所有對象的,這樣合并就節(jié)省了一次遍歷對象圖的開銷。
ZGC存在的問題
ZGC最大的問題是浮動垃圾。
浮動垃圾
ZGC的停頓時間是在10ms以下,但是ZGC的執(zhí)行時間還是遠遠大于這個時間的。假如ZGC全過程需要執(zhí)行10分鐘,在這個期間由于對象分配速率很高,將創(chuàng)建大量的新對象,這些對象很難進入當(dāng)次GC,所以只能在下次GC的時候進行回收,這些只能等到下次GC才能回收的對象就是浮動垃圾。
ZGC沒有分代概念,每次都需要進行全堆掃描,導(dǎo)致一些“朝生夕死”的對象沒能及時的被回收。
解決方案
目前唯一的辦法是增大堆的容量,使得程序得到更多的喘息時間,但是這個也是一個治標(biāo)不治本的方案。如果需要從根本上解決這個問題,還是需要引入分代收集,讓新生對象都在一個專門的區(qū)域中創(chuàng)建,然后專門針對這個區(qū)域進行更頻繁、更快的收集。
官方測試數(shù)據(jù)
停頓時間
在ZGC的停頓時間測試上,和其他收集器相比完全不在一個數(shù)量級,如圖:
吞吐量
ZGC的“弱項”吞吐量方面,以低延遲為首要目標(biāo)的ZGC已經(jīng)達到了以高吞吐量為目標(biāo)Parallel Scavenge的99%,直接超越了G1,如圖:
優(yōu)缺點
- 優(yōu)點:低停頓,高吞吐量,ZGC收集過程中額外耗費的內(nèi)存小
- 缺點:浮動垃圾
參考
《深入理解JAVA虛擬機》
總結(jié)
以上是生活随笔為你收集整理的深入理解JVM - ZGC垃圾收集器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux apache http403
- 下一篇: Tkinter:事件绑定