volatile关键字——保证并发编程中的可见性、有序性
文章目錄
- 一.緩存一致性問題
- 二.并發編程中的三個概念
- 三.Java線程內存模型
- 1.原子性
- 2.可見性
- 3.有序性
- 四.深入剖析volatile關鍵字
- 1.volatile關鍵字的兩層語義
- 2.volatile保證原子性嗎?
- 3.volatile能保證有序性嗎?
- 4.volatile的原理和實現機制
- 五.使用volatile關鍵字的場景
? ? ? ?volatile關鍵字的作用簡單來說在匯編語言層加lock指令 ,保證了Java并發編程中的可見性、有序性,但不能保證原子性。保證原子性需要使用synchronized和lock,但是性能會差些,所以在一些已經是原子性操作的情況下,可以使用volatile關鍵字。
? ? ? ?volatile關鍵字是與Java的內存模型有關的,因此在理解volatile關鍵字之前,我們需要來了解一下與內存模型相關的概念和知識。
一.緩存一致性問題
? ? ? ?大家都知道,計算機在執行程序時,每條指令都是在CPU中執行的,而執行指令過程中,勢必涉及到數據的讀取和寫入。由于程序運行過程中的臨時數據是存放在主存(物理內存)當中的,這時就存在一個問題,由于CPU執行速度很快,而從內存讀取數據和寫入數據的過程跟CPU執行指令的速度比起來要慢的多,會大大降低指令執行的速度。因此在CPU里面就有了高速緩存。
? ? ? ?也就是,當程序在運行過程中,會將運算需要的數據從主存復制一份到CPU的高速緩存當中,那么CPU進行計算時就可以直接從它的高速緩存讀取數據和向其中寫入數據,當運算結束之后,再將高速緩存中的數據刷新到主存當中。內存交互操作有8種,虛擬機實現必須保證每一個操作都是原子的,不可在分的
read (讀取):從主內存讀取數據
load (載入):把read操作從主存中讀取的變量值放入工作內存中
use (使用):把工作內存中的變量傳輸給CPU使用
assign (賦值):把從CPU中計算好的值放入工作內存中
store (存儲):從工作內存中寫入到主內存中,以便后續的write使用
write (寫入):它把store操作存到主內存的值賦值給對應變量
lock (鎖定):把一個變量加鎖,標識為線程獨占狀態
unlock (解鎖):,它把一個處于鎖定狀態的變量釋放出來,釋放后的變量才可以被其他線程鎖定
JMM對這八種指令的使用,制定了如下規則:
不允許read和load、store和write操作之一單獨出現。即使用了read必須load,使用了store必須write
不允許線程丟棄他最近的assign操作,即工作變量的數據改變了之后,必須告知主存
不允許一個線程將沒有assign的數據從工作內存同步回主內存
一個新的變量必須在主內存中誕生,不允許工作內存直接使用一個未被初始化的變量。就是對變量實施use、store操作之前,必須經過assign和load操作
一個變量同一時間只有一個線程能對其進行lock。多次lock后,必須執行相同次數的unlock才能解鎖
如果對一個變量進行lock操作,會清空所有工作內存中此變量的值,在執行引擎使用這個變量前,必須重新load或assign操作初始化變量的值
如果一個變量沒有被lock,就不能對其進行unlock操作。也不能unlock一個被其他線程鎖住的變量
對一個變量進行unlock操作之前,必須把此變量同步回主內存
但是當多個線程操作同一個變量時,就會發生緩存一致性問題。通常稱這種被多個線程訪問的變量為共享變量。
為了解決緩存不一致性問題,通常來說有以下2種解決方法:
1)通過在總線加LOCK鎖的方式
2)通過緩存一致性協議
這2種方式都是硬件層面上提供的方式。
? ? ? ?在早期的CPU當中,是通過在總線上加LOCK鎖的形式來解決緩存不一致的問題。因為CPU和其他部件進行通信都是通過總線來進行的,如果某個線程對總線加LOCK鎖,會阻塞了其他CPU對內存訪問,只有等待這段代碼完全執行完畢之后,其他CPU才能從內存讀取變量,然后進行相應的操作。這樣就解決了緩存不一致的問題。但是這種方式由于在鎖住總線期間,其他CPU無法訪問內存,效率非常低下。
? ? ? ?所以就出現了緩存一致性協議。最出名的就是Intel 的MESI協議,MESI協議保證了每個緩存中使用的共享變量的副本是一致的。它核心的思想是:線程通過總線嗅探機制,監聽到共享變量的改變,將本線程該變量的緩存行置為無效狀態,需要從內存重新讀取。
二.并發編程中的三個概念
在并發編程中,我們通常會遇到以下三個問題:原子性問題,可見性問題,有序性問題。
可見性
指當多個線程訪問同一個變量時,如果一個線程修改了這個變量的值,其他線程能夠立即看得到修改的值。
舉個簡單的例子,看下面這段代碼:
//線程1執行的代碼 int i = 0; i = 10;//線程2執行的代碼 j = i;? ? ? ?假若執行線程1的是CPU1,執行線程2的是CPU2。由上面的分析可知,當線程1執行 i =10這句時,會先把i的初始值加載到CPU1的高速緩存中,然后賦值為10,那么在CPU1的高速緩存當中i的值變為10了,卻沒有立即寫入到主存當中。
? ? ? ?此時線程2執行 j = i,它會先去主存讀取i的值并加載到CPU2的緩存當中,注意此時內存當中i的值還是0,那么就會使得j的值為0,而不是10.
? ? ? ?這就是可見性問題,線程1對變量i修改了之后,線程2沒有立即看到線程1修改的值。
有序性:
即程序執行的順序按照代碼的先后順序執行。舉個簡單的例子,看下面這段代碼:
? ? ? ?上面代碼定義了一個int型變量,定義了一個boolean類型變量,然后分別對兩個變量進行賦值操作。從代碼順序上看,語句1是在語句2前面的,那么JVM在真正執行這段代碼的時候會保證語句1一定會在語句2前面執行嗎?不一定,為什么呢?這里可能會發生指令重排序(Instruction Reorder)。
? ? ? ?下面解釋一下什么是指令重排序,一般來說,處理器為了提高程序運行效率,可能會對輸入代碼進行優化,它不保證程序中各個語句的執行先后順序同代碼中的順序一致,但是它會保證程序最終執行結果和代碼順序執行的結果是一致的。
? ? ? ?比如上面的代碼中,語句1和語句2誰先執行對最終的程序結果并沒有影響,那么就有可能在執行過程中,語句2先執行而語句1后執行。
? ? ? ?但是要注意,雖然處理器會對指令進行重排序,但是它會保證程序最終結果會和代碼順序執行結果相同,因為處理器在進行重排序時是會考慮指令之間的數據依賴性,如果一個指令Instruction 2必須用到Instruction 1的結果,那么處理器會保證Instruction 1會在Instruction 2之前執行。
? ? ? ?雖然重排序不會影響單個線程內程序執行的結果,但是多線程呢?下面看一個例子:
//線程1:context = loadContext(); //語句1inited = true; //語句2//線程2:while(!inited ){sleep()}doSomethingwithconfig(context);? ? ? ?上面代碼中,由于語句1和語句2沒有數據依賴性,因此可能會被重排序。假如發生了重排序,在線程1執行過程中先執行語句2,而此是線程2會以為初始化工作已經完成,那么就會跳出while循環,去執行doSomethingwithconfig(context)方法,而此時context并沒有被初始化,就會導致程序出錯。
? ? ? ?從上面可以看出,指令重排序不會影響單個線程的執行,但是會影響到多個線程并發執行的正確性。
? ? ? ?也就是說,要想并發程序正確地執行,必須要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會導致程序運行不正確。
三.Java線程內存模型
? ? ? ?在前面談到了一些關于內存模型以及并發編程中可能會出現的一些問題。下面我們來看一下Java內存模型,研究一下Java內存模型為我們提供了哪些保證以及在java中提供了哪些方法和機制來讓我們在進行多線程編程時能夠保證程序執行的正確性。
? ? ? ?在Java虛擬機規范中試圖定義一種Java內存模型(Java Memory Model,JMM)來屏蔽各個硬件平臺和操作系統的內存訪問差異,以實現讓Java程序在各種平臺下都能達到一致的內存訪問效果。那么Java內存模型規定了哪些東西呢,它定義了程序中變量的訪問規則,往大一點說是定義了程序執行的次序。注意,為了獲得較好的執行性能,Java內存模型并沒有限制執行引擎使用處理器的寄存器或者高速緩存來提升指令執行速度,也沒有限制編譯器對指令進行重排序。也就是說,在java內存模型中,也會存在緩存一致性問題和指令重排序的問題。
? ? ? ?Java內存模型規定所有的變量都是存在主存當中(類似于前面說的物理內存),每個線程都有自己的工作內存(類似于前面的高速緩存)。線程對變量的所有操作都必須在工作內存中進行,而不能直接對主存進行操作。并且每個線程不能訪問其他線程的工作內存。
? ? ? ?舉個簡單的例子:在java中,執行下面這個語句:
i = 10;? ? ? ?執行線程必須先在自己的工作線程中對變量i所在的緩存行進行賦值操作,然后再寫入主存當中。而不是直接將數值10寫入主存當中。
? ? ? ?那么Java語言本身對原子性、可見性以及有序性提供了哪些保證呢?
1.原子性
? ? ? ?在Java中,對基本數據類型的變量的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要么執行,要么不執行。
? ? ? ?上面一句話雖然看起來簡單,但是理解起來并不是那么容易。看下面一個例子i:
? ? ? ?請分析以下哪些操作是原子性操作:
x = 10; //語句1y = x; //語句2x++; //語句3x = x + 1; //語句4? ? ? ?咋一看,有些朋友可能會說上面的4個語句中的操作都是原子性操作。其實只有語句1是原子性操作,其他三個語句都不是原子性操作。
? ? ? ?語句1是直接將數值10賦值給x,也就是說線程執行這個語句的會直接將數值10寫入到工作內存中。
? ? ? ?語句2實際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作內存,然后創建變量y,并將10嗎賦值給y,然后寫入主存中,雖然規定讀取x的值和load進工作內存是原子性操作,但和后面的創建變量y合起來明顯不是原子操作。
? ? ? ?同樣的,x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值。
? ? ? ?所以上面4個語句只有語句1的操作具備原子性。
? ? ? ?也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變量,變量之間的相互賦值不是原子操作)才是原子操作。
Java中的原子操作包括:
1)除long和double之外的基本類型的賦值操作
2)所有引用reference的賦值操作
3)java.concurrent.Atomic.* 包中所有類的一切操作。
? ? ? ?但是java對long和double的賦值操作是非原子操作!!long和double占用的字節數都是8,也就是64bits。在32位操作系統上對64位的數據的讀寫要分兩步完成,每一步取32位數據。這樣對double和long的賦值操作就會有問題:如果有兩個線程同時寫一個變量內存,一個進程寫低32位,而另一個寫高32位,這樣將導致獲取的64位數據是失效的數據。因此需要使用volatile關鍵字來防止此類現象。volatile本身不保證獲取和設置操作的原子性,僅僅保持修改的可見性。但是java的內存模型保證聲明為volatile的long和double變量的get和set操作是原子的。(from http://www.iteye.com/topic/213794)
? ? ? ?從上面可以看出,Java內存模型只保證了基本讀取和賦值是原子性操作,如果要實現更大范圍操作的原子性,可以通過synchronized和Lock來實現。由于synchronized和Lock能夠保證任一時刻只有一個線程執行該代碼塊,那么自然就不存在原子性問題了,從而保證了原子性。
2.可見性
? ? ? ?volatile關鍵字可以來保證可見性。當一個共享變量被volatile修飾時,它會保證修改的值會立即更新到主存,當有其他線程需要讀取時,它會去內存中讀取新值。
? ? ? ?而普通的共享變量不能保證可見性,因為普通共享變量被修改之后,什么時候被寫入主存是不確定的,當其他線程去讀取時,此時內存中可能還是原來的舊值,因此無法保證可見性。
? ? ? ?另外,通過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個線程獲取鎖然后執行同步代碼,并且在釋放鎖之前會將對變量的修改刷新到主存當中。因此可以保證可見性。
3.有序性
? ? ? ?在Java內存模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單線程程序的執行,卻會影響到多線程并發執行的正確性。
? ? ? ?在Java里面,可以通過volatile關鍵字來保證一定的“有序性”(具體原理在下一節講述)。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個線程執行同步代碼,相當于是讓線程順序執行同步代碼,自然就保證了有序性。
? ? ? ?另外,Java內存模型具備一些先天的有序性,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推導出來,那么它們就不能保證它們的有序性,虛擬機可以隨意地對它們進行重排序。可以看我的另一篇文章happens-before規則,happens-before規則面試也會問到。
四.深入剖析volatile關鍵字
在前面講述了很多東西,其實都是為講述volatile關鍵字作鋪墊,那么接下來我們就進入主題。
1.volatile關鍵字的兩層語義
一旦一個共享變量(類的成員變量、類的靜態成員變量)被volatile修飾之后,那么就具備了兩層語義:
1)保證了不同線程對這個變量進行操作時的可見性,即一個線程修改了某個變量的值,這新值對其他線程來說是立即可見的。
2)禁止進行指令重排序。
先看一段代碼,假如線程1先執行,線程2后執行:
//線程1boolean stop = false;while(!stop){doSomething();}//線程2stop = true;? ? ? ?這段代碼是很典型的一段代碼,很多人在中斷線程時可能都會采用這種標記辦法。但是事實上,這段代碼會完全運行正確么?即一定會將線程中斷么?不一定,也許在大多數時候,這個代碼能夠把線程中斷,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是只要一旦發生這種情況就會造成死循環了)。
? ? ? ?下面解釋一下這段代碼為何有可能導致無法中斷線程。在前面已經解釋過,每個線程在運行過程中都有自己的工作內存,那么線程1在運行的時候,會將stop變量的值拷貝一份放在自己的工作內存當中。
? ? ? ?那么當線程2更改了stop變量的值之后,但是還沒來得及寫入主存當中,線程2轉去做其他事情了,那么線程1由于不知道線程2對stop變量的更改,因此還會一直循環下去。
? ? ? ?但是用volatile修飾之后就變得不一樣了:
? ? ? ?第一:使用volatile關鍵字會強制將修改的值立即寫入主存;
? ? ? ?第二:使用volatile關鍵字的話,當線程2進行修改時,會導致線程1的工作內存中緩存變量stop的緩存行無效(反映到硬件層的話,就是CPU的L1或者L2緩存中對應的緩存行無效);
? ? ? ?第三:由于線程1的工作內存中緩存變量stop的緩存行無效,所以線程1再次讀取變量stop的值時會去主存讀取。
? ? ? ?那么在線程2修改stop值時(當然這里包括2個操作,修改線程2工作內存中的值,然后將修改后的值寫入內存),會使得線程1的工作內存中緩存變量stop的緩存行無效,然后線程1讀取時,發現自己的緩存行無效,它會等待緩存行對應的主存地址被更新之后,然后去對應的主存讀取最新的值。
? ? ? ?那么線程1讀取到的就是最新的正確的值。
2.volatile保證原子性嗎?
從上面知道volatile關鍵字保證了操作的可見性,但是volatile能保證對變量的操作是原子性嗎?
下面看一個例子:
public class Test {public volatile int inc = 0;public void increase() {inc++;}public static void main(String[] args) {final Test test = new Test();for(int i=0;i<10;i++){new Thread(){public void run() {for(int j=0;j<1000;j++)test.increase();};}.start();}while(Thread.activeCount()>1) //保證前面的線程都執行完Thread.yield();System.out.println(test.inc);}}? ? ? ?大家想一下這段程序的輸出結果是多少?也許有些朋友認為是10000。但是事實上運行它會發現每次運行結果都不一致,大多都是一個小于10000的數字。
? ? ? ?可能有的朋友就會有疑問,不對啊,上面是對變量inc進行自增操作,由于volatile保證了可見性,那么在每個線程中對inc自增完之后,在其他線程中都能看到修改后的值啊,所以有10個線程分別進行了1000次操作,那么最終inc的值應該是1000*10=10000。
? ? ? ?這里面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,但是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變量的操作的原子性。
原因分析:
在前面已經提到過,自增操作是不具備原子性的,它包括讀取變量的原始值、進行加1操作、寫入工作內存。
? ? ? ?假設此時num的值為10,線程A將變量讀進自己的工作內存中,此時發生了CPU切換,B也將num=10讀進自己的工作內存,CPU進行加1并assign給緩存的num變量副本,但此時還沒有刷新到主內存。此時線程A將num值寫回到主內存,導致B線程的num值失效,B線程需要重新去主內存中讀取num值。這時就可以看出來B線程的一次自增操作被丟失掉了!
對自增操作使用synchronized或者lock加鎖,就不會有這樣的問題了。或者采用AtomicInteger:
public class Test {public AtomicInteger inc = new AtomicInteger();public void increase() {inc.getAndIncrement();}public static void main(String[] args) {final Test test = new Test();for(int i=0;i<10;i++){new Thread(){public void run() {for(int j=0;j<1000;j++)test.increase();};}.start();}while(Thread.activeCount()>1) //保證前面的線程都執行完Thread.yield();System.out.println(test.inc);} }? ? ? ?在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類,即對基本數據類型的 自增、自減、加法操作和減法操作進行了封裝,保證這些操作是原子性操作。atomic是利用CAS來實現原子性操作的(Compare And Swap),CAS實際上是利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操作。
3.volatile能保證有序性嗎?
在前面提到volatile關鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。
volatile關鍵字禁止指令重排序有兩層意思:
1)當程序執行到volatile變量的讀操作或者寫操作時,在其前面的操作的更改肯定全部已經進行,且結果已經對后面的操作可見;在其后面的操作肯定還沒有進行;
2)在進行指令優化時,不能將在對volatile變量訪問的語句放在其后面執行,也不能把volatile變量后面的語句放到其前面執行。
可能上面說的比較繞,舉個簡單的例子:
//x、y為非volatile變量 //flag為volatile變量x = 2; //語句1 y = 0; //語句2 flag = true; //語句3 x = 4; //語句4 y = -1; //語句5由于flag變量為volatile變量,那么在進行指令重排序的過程的時候,不會將語句3放到語句1、語句2前面,也不會講語句3放到語句4、語句5后面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。
并且volatile關鍵字能保證,執行到語句3時,語句1和語句2必定是執行完畢了的,且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。
那么我們回到前面舉的一個例子:
//線程1:context = loadContext(); //語句1inited = true; //語句2//線程2:while(!inited ){sleep()}doSomethingwithconfig(context);前面舉這個例子的時候,提到有可能語句2會在語句1之前執行,那么久可能導致context還沒被初始化,而線程2中就使用未初始化的context去進行操作,導致程序出錯。
這里如果用volatile關鍵字對inited變量進行修飾,就不會出現這種問題了,因為當執行到語句2時,必定能保證context已經初始化完畢。
4.volatile的原理和實現機制
前面講述了源于volatile關鍵字的一些使用,下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。
下面這段話摘自《深入理解Java虛擬機》:
“觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的匯編代碼發現,加入volatile關鍵字時,會多出一個lock前綴指令”
是在store之前加鎖,粒度更小了。
lock前綴指令實際上相當于一個內存屏障(也成內存柵欄),內存屏障會提供3個功能:
1)它確保指令重排序時不會把其后面的指令排到內存屏障之前的位置,也不會把前面的指令排到內存屏障的后面;即在執行到內存屏障這句指令時,在它前面的操作已經全部完成;
2)它會強制將對緩存的修改操作立即寫入主存;
3)如果是寫操作,它會導致其他CPU中對應的緩存行無效。
五.使用volatile關鍵字的場景
? ? ? ?synchronized、Lock關鍵字可以避免可見性、有序性、原子性的問題,從而保證并發程序的安全性,但volatile關鍵字在某些情況下性能要優于synchronized。但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。
? ? ? ?根據以上volatile的特點,volatile可以用于那些不需要原子性,或者說原子性已經得到保障的場合:
下面列舉幾個Java中使用volatile的幾個場景。
1.狀態標記量
volatile boolean shutdownRequested public void shutdown() {shutdownRequested = true;}public void work() {while(shutdownRequested) {//do stuff}}//只要線程對shutdownRequested進行修改,執行work的線程會立即看到,因此會立即停止下來,如果不加volatile的話,它每次去工作內存中讀取數據一直是個true,一直執行,都不知道別人已經讓它停了
volatile boolean inited = false;//線程1:context = loadContext(); inited = true; //線程2:while(!inited ){sleep()}doSomethingwithconfig(context);2.double check實現的單例模式
class Singleton{private volatile static Singleton instance = null;private Singleton() {}public static Singleton getInstance() {if(instance==null) {synchronized (Singleton.class) {if(instance==null)instance = new Singleton();}}return instance;}}正確使用 Volatile 變量的場景
總結
以上是生活随笔為你收集整理的volatile关键字——保证并发编程中的可见性、有序性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: postgreSQL的索引
- 下一篇: java线上排查利器arthas