一文看懂Java内存模型(JMM)
文章目錄
- Java內存模型介紹
- 總覽圖
- Java內存模型圖
- 線程、主內存、工作內存關系圖
- CPU緩存架構圖
- Java內存模型與硬件內存架構的關系
- 什么是Java內存模型
- Java內存模型的意義
- Java內存模型規范
- Java內存模型的主要結構
- 1、程序計數器(Program Counter Register)
- 2、Java 虛擬機棧(Java Virtual Machine Stacks)
- 棧幀(Stack Frame)
- 3、本地方法棧(Native Method Stacks)
- 4、堆(Heap)
- 4、方法區(Method Area)
- 運行時常量池(Runtime Constant Pool)
- 5、直接內存(Direct Memory)
- JMM與八大原子操作
- Java內存的訪問方式
- Java內存加載和使用對象
- Java內存垃圾回收
- 字節碼執行引擎
Java內存模型介紹
總覽圖
Java內存模型圖
線程、主內存、工作內存關系圖
CPU緩存架構圖
Java內存模型與硬件內存架構的關系
什么是Java內存模型
所謂內存模型就是對特定的內存或者高速緩存進行讀寫訪問的過程抽象描述和約定,不同架構下的物理機或者操作系統擁有不一樣的內存模型,而Java虛擬機是一個實現了跨平臺的虛擬系統。
首先它不是對物理內存的規范,而是在Java虛擬機基礎上進行的規范從而實現平臺一致性,以達到Java程序能夠**“一次編譯,到處運行”**的目標。
Java內存模型的意義
在多核系統中,處理器一般有一層或者多層的緩存,這些的緩存通過加速數據訪問(因為數據距離處理器更近)和降低共享內存在總線上的通訊(因為本地緩存能夠滿足許多內存操作)來提高CPU性能。緩存能夠大大提升性能,但是它們也帶來了許多挑戰。每個處理器的緩存都是私有的,而它們又共享同一內存,當有多個處理器的操作涉及同一塊內存區域的時候,他們的緩存可能會因為運算而導致不一致,在這種情況下,同步回內存的數據以誰的為準呢?這就是緩存一致性問題。
編譯器在編譯的時候,允許重排序指令以優化運行速度。CPU在執行指令的時候,為了使處理器內部運算單元能被充分利用,也可以對指令進行亂序執行。
在編譯器和CPU進行重排序的時候,要遵循“as-if-serial”原則,也就是要保證程序單線程執行的時候,重排序之后程序的運行結果必須和重排序前程序的運行結果一致。這里注意“as-if-serial”原則只保證單線程的執行結果不變,不保證多線程執行的結果不變。那么如何保證多線程程序的正確運行?顯然需要某種協議來限定多線程執行時要滿足的規則。
為了解決緩存一致性和cpu指令重排序的問題,同時屏蔽不同機器下CPU架構不一致的問題,于是java就定義了一種協議,這個協議就是Java內存模型(JMM)。
Java內存模型規范
在java中,所有實例域、靜態域和數組元素存儲在堆內存中,堆內存在線程之間共享。局部變量(Local variables),方法定義參數(java語言規范稱之為formal method parameters)和異常處理器參數(exception handler parameters)不會在線程之間共享,它們不會有內存可見性問題,也不受內存模型的影響。
官方提供的關于Java內存模型和線程規范是JSR-133規范,由JSR-133專家組開發。
JSR-133中文版下載
JMM規定了所有的變量都存儲在主內存(Main Memory)中。每個線程還有自己的工作內存(Working Memory),線程的工作內存中保存了該線程使用到的變量的主內存的副本拷貝,線程對變量的所有操作(讀取、賦值等)都必須在工作內存中進行,而不能直接讀寫主內存中的變量(volatile變量仍然有工作內存的拷貝,但是由于它特殊的操作順序性規定,所以看起來如同直接在主內存中讀寫訪問一般)。不同的線程之間也無法直接訪問對方工作內存中的變量,線程之間值的傳遞都需要通過主內存來完成。
需要注意的是java內存模型僅僅是定義了一個規范,不同的JVM它的實現可能不盡相同,本文所介紹的以Hotspot虛擬機(它是Sun JDK和OpenJDK中所帶的虛擬機,也是目前使用范圍最廣的Java虛擬機)為準。
Java內存模型的主要結構
java虛擬機的結構主要分為四大塊:類加載子系統、垃圾回收器、運行時數據區、字節碼加載子系統。
關于類加載子系統的原理可以參考這篇:Java對象的生命周期
Java 虛擬機在執行 Java 程序的過程中會把它管理的內存劃分成若干個不同的數據區域,這便是運行時數據區的結構,也可以看作為java內存模型的主要結構,其中又分為線程共享區和線程私有區。
-
線程私有
- 程序計數器
- 虛擬機棧
- 本地方法棧
-
線程共享
- 堆
- 元空間(以前叫方法區)
如下圖所示:
1、程序計數器(Program Counter Register)
? 首先程序計數器是線程私有的,同時也是一塊較小的內存空間,它的作用可以看做是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型里(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
? 由于Java 虛擬機的多線程是通過線程輪流切換并分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內核)只會執行一條線程中的指令。因此,為了線程切換后能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲。
? 如果線程正在執行的是一個Java 方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Natvie 方法,這個計數器值則為空(Undefined)。此內存區域是唯一一個在Java 虛擬機規范中沒有規定任何OutOfMemoryError 情況的區域。
總結主要有兩個作用:
- 字節碼解釋器通過改變程序計數器依次讀取指令,實現代碼的流程控制,如:順序執行、選擇、循環、異常處理
- 多線程情況下,程序計數器用于記錄當前線程執行的位置,從而當線程被切換回來的時候能夠知道該線程上次運行到哪了
2、Java 虛擬機棧(Java Virtual Machine Stacks)
? 與程序計數器一樣,Java 虛擬機棧也是線程私有的,它的生命周期與線程相同。虛擬機棧描述的是Java 方法執行的內存模型:每個方法被執行的時候都會同時創建一個棧幀(Stack Frame)用于存儲局部變量表、操作棧、動態鏈接、方法出口等信息。每一個方法被調用直至執行完成的過程,就對應著一個棧幀在虛擬機棧中從入棧到出棧的過程。
? 局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference 類型,它不等同于對象本身,根據不同的虛擬機實現,它可能是一個指向對象起始地址的引用指針,也可能指向一個代表對象的句柄或者其他與此對象相關的位置)和returnAddress 類型(指向了一條字節碼指令的地址)。其中64 位長度的long 和double 類型的數據會占用2 個局部變量空間(Slot),其余的數據類型只占用1 個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。
? 在Java 虛擬機規范中,對這個區域規定了兩種異常狀況:如果線程請求的棧深度大于虛擬機所允許的深度,將拋出StackOverflowError 異常;當前大部分的Java 虛擬機都可動態擴展,只不過Java 虛擬機規范中也允許固定長度的虛擬機棧,當擴展時無法申請到足夠的內存時會拋出OutOfMemoryError 異常。
棧幀(Stack Frame)
-
棧幀是方法運行的基本結構,一個棧幀即對應一個方法。
-
正在執行的方法稱為當前活動棧幀
-
在執行引擎運行時,所有指令都只能針對當前活動棧幀操作
-
壓棧過多會產生StackOverflowError異常,表示請求的棧溢出,導致線程可用內存耗盡,通常出現于遞歸方法深度過大或者死遞歸情況,默認分配的內存大小為1M,可以使用-Xss 參數配置棧空間大小。
-
虛擬機棧通過壓/出棧,對每個方法對應的活動棧幀進行運算處理,方法正常執行結束,則跳轉到另一個棧幀上。
-
在執行的過程中,如果出現異常,會進行異常回溯,返回地址通過異常處理表確定。
關于棧幀的詳細原理請參考Java代碼的執行原理
3、本地方法棧(Native Method Stacks)
? 本地方法棧與虛擬機棧所發揮的作用是非常相似的,其區別不過是虛擬機棧為虛擬機執行Java 方法(也就是字節碼)服務,而本地方法棧則是為虛擬機使用到的Native 方法服務。虛擬機規范中對本地方法棧中的方法使用的語言、使用方式與數據結構并沒有強制規定,因此具體的虛擬機可以自由實現它。甚至有的虛擬機(譬如Sun HotSpot 虛擬機)直接就把本地方法棧和虛擬機棧合二為一。與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError 和OutOfMemoryError異常。
4、堆(Heap)
? Java 堆通常是Java 虛擬機所管理的內存中最大的一塊。Java 堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這里分配內存。這一點在Java 虛擬機規范中的描述是:所有的對象實例以及數組都要在堆上分配,但是隨著JIT 編譯器的發展與逃逸分析技術的逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的對象都分配在堆上也漸漸變得不是那么“絕對”了。
? Java 堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC 堆”(Garbage Collected Heap)。如果從內存回收的角度看,由于現在收集器基本都是采用的分代收集算法,所以Java 堆中還可以細分為:新生代和老年代;再細致一點的有Eden 空間、From Survivor 空間、To Survivor 空間等。如果從內存分配的角度看,線程共享的Java 堆中可能劃分出多個線程私有的分配緩沖區(Thread Local Allocation Buffer,TLAB)。不過,無論如何劃分,都不會改變存放內容,進一步劃分的目的是為了更好更快地分配和回收內存。
? 根據Java 虛擬機規范的規定,Java 堆可以處于物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms 配置參數控制)。如果在堆中沒有完成實例分配內存,并且堆也無法再擴展時,將會拋出OutOfMemoryError 異常。
4、方法區(Method Area)
? 方法區也叫永久代(Permanent Generation Space),在JDK8以后,又被稱為元空間(Metaspace)。
? 方法區與Java 堆一樣,是各個線程共享的內存區域,它用于存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據。雖然Java 虛擬機規范把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java 堆區分開來。對于習慣在HotSpot 虛擬機上開發和部署程序的開發者來說,很多人愿意把方法區稱為“永久代”(Permanent Generation),本質上兩者并不等價,僅僅是因為HotSpot 虛擬機的設計團隊選擇把GC 分代收集擴展至方法區,或者說使用永久代來實現方法區而已。對于其他虛擬機(如BEA JRockit、IBM J9 等)來說是不存在永久代的概念的。即使是HotSpot 虛擬機本身,在JDK8以后,已經放棄永久代并“搬家”至Native Memory 來實現方法區的規劃了。
? Java 虛擬機規范對這個區域的限制非常寬松,除了和Java 堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行為在這個區域是比較少出現的,但并非數據進入了方法區就如永久代的名字一樣“永久”存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是有必要的。
? 在Sun 公司的BUG 列表中,曾出現過的若干個嚴重的BUG 就是由于低版本的HotSpot 虛擬機對此區域未完全回收而導致內存泄漏。根據Java 虛擬機規范的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError 異常。
堆大小配置不會影響元空間大小,因為Metaspace是一個堆外數據區。為了限制Metaspace大小,我們可以使用以下方式配置:
- -XX:MetaspaceSize和-XX:MaxMetaspaceSize設置最小和最大元空間大小
- 在Java 8之前,-XX:PermSize和-XX:MaxPermSize設置最小和最大PermGen大小
運行時常量池(Runtime Constant Pool)
運行時常量池是方法區的一部分,用于存放編譯期間生成的各種字面常量和符號引用。
**JDK1.7及之后版本的 JVM 已經將運行時常量池從方法區中移了出來,在 Java 堆(Heap)中開辟了一塊區域存放運行時常量池。**所以,準確來講,運行時常量池又只能說邏輯上是屬于方法區的。
? Class 文件中除了有類的版本、字段、方法、接口等描述等信息外,還有一項信息是常量池(Constant Pool Table),用于存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載后存放到方法區的運行時常量池中。Java 虛擬機對Class 文件的每一部分(自然也包括常量池)的格式都有嚴格的規定,每一個字節用于存儲哪種數據都必須符合規范上的要求,這樣才會被虛擬機認可、裝載和執行。但對于運行時常量池,Java 虛擬機規范沒有做任何細節的要求,不同的提供商實現的虛擬機可以按照自己的需要來實現這個內存區域。不過,除了保存Class 文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常量池中。
? 運行時常量池相對于Class 文件常量池的另外一個重要特征是具備動態性,Java 語言并不要求常量一定只能在編譯期產生,也就是并非預置入Class 文件中常量池的內容才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String 類的intern() 方法。
? 既然運行時常量池是方法區的一部分,自然會受到方法區內存的限制,當常量池無法再從方法區(元空間)申請到內存時會拋出OutOfMemoryError 異常。
5、直接內存(Direct Memory)
? 直接內存(也就是本地內存)并不是虛擬機運行時數據區的一部分,也不是Java虛擬機規范中定義的內存區域,但是要使用Java內存模型則必須和直接內存打交道,同時這部分內存也被頻繁地使用,也可能導致OutOfMemoryError 異常出現。
? 在JDK 1.4 中新加入了NIO(New Input/Output)類,引入了一種基于通道(Channel)與緩沖區(Buffer)的I/O 方式,它可以使用Native 函數庫直接分配堆外內存,然后通過一個存儲在Java 堆里面的DirectByteBuffer 對象作為這塊內存的引用進行操作。這樣能在一些場景中顯著提高性能,因為避免了在Java 堆和Native 堆中來回復制數據。顯然,本機直接內存的分配不會受到Java 堆大小的限制,但是,既然是內存,則肯定還是會受到本機總內存(包括RAM 及SWAP 區或者分頁文件)的大小及處理器尋址空間的限制。
? 我們可以使用 -XX:MaxDirectMemorySize 設置最大直接內存。服務器管理員配置虛擬機參數時,一般會根據實際內存設置-Xmx等參數信息,但經常會忽略掉直接內存,使得各個內存區域的總和大于物理內存限制(包括物理上的和操作系統級的限制),從而導致動態擴展時出現OutOfMemoryError異常。
JMM與八大原子操作
關于主內存與工作內存之間具體的交互協議,即一個變量如何從主內存拷貝到工作內存、如何從工作內存同步回主內存這一類的實現細節,Java內存模型中定義了以下8種操作來完成。Java虛擬機實現時必須保證下面提及的每一種操作都是原子的、不可再分的(對于double和long類型的變量來說,load、store、read和write操作在某些平臺上允許有例外)。
八大原子操作:
- lock(鎖定):作用于主內存的變量,它把一個變量標識為一條線程獨占的狀態。
- unlock(解鎖):作用于主內存的變量,它把一個處于鎖定狀態的變量釋放出來,釋放后的變量才可以被其他線程鎖定。
- read(讀取):作用于主內存的變量,它把一個變量的值從主內存傳輸到線程的工作內存中,以便隨后的load動作使用。
- load(載入):作用于工作內存的變量,它把read操作從主內存中得到的變量值放入工作內存的變量副本中。
- use(使用):作用于工作內存的變量,它把工作內存中一個變量的值傳遞給執行引擎,每當虛擬機遇到一個需要使用變量的值的字節碼指令時將會執行這個操作。
- assign(賦值):作用于工作內存的變量,它把一個從執行引擎接收的值賦給工作內存的變量,每當虛擬機遇到一個給變量賦值的字節碼指令時執行這個操作。
- store(存儲):作用于工作內存的變量,它把工作內存中一個變量的值傳送到主內存中,以便隨后的write操作使用。
- write(寫入):作用于主內存的變量,它把store操作從工作內存中得到的變量的值放入主內存的變量中。
如果要把一個變量從主內存拷貝到工作內存,那就要按順序執行read和load操作,如果要把變量從工作內存同步回主內存,就要按順序執行store和write操作。注意,Java內存模型只要求上述兩個操作必須按順序執行,但不要求是連續執行。也就是說read與load之間、store與write之間是可插入其他指令的,如對主內存中的變量a、b進行訪問時,一種可能出現的順序是read a、read b、load b、load a。
同時Java內存模型還規定了在執行上述八種原子操作時必須滿足如下規則:
- 不允許read和load、store和write操作之一單獨出現,即不允許一個變量從主內存讀取了但工作內存不接受,或者工作內存發起回寫了但主內存不接受的情況出現。
- 不允許一個線程丟棄它最近的assign操作,即變量在工作內存中改變了之后必須把該變化同步回主內存。
- 不允許一個線程無原因地(沒有發生過任何assign操作)把數據從線程的工作內存同步回主內存中。
- 一個新的變量只能在主內存中“誕生”,不允許在工作內存中直接使用一個未被初始化(load或assign)的變量,換句話說就是對一個變量實施use、store操作之前,必須先執行assign和load操作。
- 一個變量在同一個時刻只允許一條線程對其進行lock操作,但lock操作可以被同一條線程重復執行多次,多次執行lock后,只有執行相同次數的unlock操作,變量才會被解鎖。
- 如果對一個變量執行lock操作,那將會清空工作內存中此變量的值,在執行引擎使用這個變量前,需要重新執行load或assign操作以初始化變量的值。
- 如果一個變量事先沒有被lock操作鎖定,那就不允許對它執行unlock操作,也不允許去unlock一個被其他線程鎖定的變量。
- 對一個變量執行unlock操作之前,必須先把此變量同步回主內存中(執行store、write操作)。
由Java內存模型來直接保證的原子性變量操作包括read、load、assign、use、store和write這六個,我們大致可以認為,基本數據類型的訪問、讀寫都是具備原子性的(例外就是long和double的非原子性協定)
Java內存的訪問方式
邏輯內存模型我們已經看到了,那當我們建立一個對象的時候是怎么進行訪問的呢?
在Java 語言中,對象訪問是如何進行的?對象訪問在Java 語言中無處不在,是最普通的程序行為,但即使是最簡單的訪問,也會卻涉及Java 棧、Java 堆、方法區這三個最重要內存區域之間的關聯關系,如下面的這句代碼:
Object obj = new Object();
假設這句代碼出現在方法體中,那“Object obj”這部分的語義將會反映到Java 棧的本地變量表中,作為一個reference 類型數據出現。而“new Object()”這部分的語義將會反映到Java 堆中,形成一塊存儲了Object 類型所有實例數據值(Instance Data,對象中各個實例字段的數據)的結構化內存,根據具體類型以及虛擬機實現的對象內存布局(Object Memory Layout)的不同,這塊內存的長度是不固定的。另外,在Java 堆中還必須包含能查找到此對象類型數據(如對象類型、父類、實現的接口、方法等)的地址信息,這些類型數據則存儲在方法區中。
由于reference 類型在Java 虛擬機規范里面只規定了一個指向對象的引用,并沒有定義這個引用應該通過哪種方式去定位,以及訪問到Java 堆中的對象的具體位置,因此不同虛擬機實現的對象訪問方式會有所不同,主流的訪問方式有以下兩種:
- 句柄:使用句柄訪問方式,Java 堆中將會劃分出一塊內存來作為句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據和類型數據各自的具體地址信息。
- 直接指針:使用直接指針的方式,引用中存儲的就是對象的地址。這也是Hotspot虛擬機采用的方式。
Java內存加載和使用對象
請參考Java對象的生命周期
Java內存垃圾回收
請參考JVM垃圾回收機制深入解析
字節碼執行引擎
請參考Java代碼的執行原理
總結
以上是生活随笔為你收集整理的一文看懂Java内存模型(JMM)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql if selected_初识
- 下一篇: java gettime_Java Ut