記憶體模型的相關概念
並發程式設計中的三個概念
Java記憶體模型
#深入剖析Volatile關鍵字
使用volatile關鍵字的場景
快取一致性問題。在多執行緒程式設計時才會出現),那麼就可能有快取不一致的問題。
#透過在匯流排加LOCK#鎖定的方式 透過快取一致性協定Model
,JMM)來屏蔽各個硬體平台和操作系統的記憶體存取差異,以實現讓Java程式在各種平台下都能達到一致的記憶體存取效果。那麼Java記憶體模型規定了哪些東西呢,它定義了程式中變數的存取規則,往大一點說是定義了程式執行的次序。請注意,為了獲得較好的執行效能,Java記憶體模型並沒有限制執行引擎使用處理器的暫存器或快取來提升指令執行速度,也沒有限制編譯器對指令進行重新排序。也就是說,在java記憶體模型中,也會有快取一致性問題和指令重新排序的問題。Java記憶體模型規定所有的變數都是存在主存當中(類似前面說的實體記憶體),每個執行緒都有自己的工作記憶體(類似前面的高速緩存)。執行緒對變數的所有操作都必須在工作記憶體中進行,而不能直接對主存進行操作。並且每個線程不能存取其他線程的工作記憶體。
在Java中,對基本
資料型別請分析下列哪一個操作是原子性運算:
x = 10; //語句1
y = x; //語句2
x++; //語句3
#x = x + 1; //語句4
其實只有語句1是原子性操作,其他三個語句都不是原子性操作。
也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變量,變數之間的相互賦值不是原子操作)才是原子運算。
從上面可以看出,Java記憶體模型只保證了基本讀取和賦值是原子性操作,如果要實現更大範圍操作的原子性,可以透過synchronized和Lock來實現。
對於可見性,Java提供了volatile關鍵字來確保可見性。
當一個共享變數被volatile修飾時,它會保證修改的值會立即被更新到主記憶體,當有其他執行緒需要讀取時,它會去記憶體中讀取新值。
而普通的共享變數無法保證可見性,因為普通共享變數被修改之後,什麼時候被寫入主存是不確定的,當其他執行緒去讀取時,此時記憶體中可能還是原來的舊值,因此無法保證可見性。
另外,透過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個執行緒取得鎖定然後執行同步程式碼,並且在釋放鎖定之前會將變數的修改刷新到主記憶體當中。因此可以保證可見性。
在Java記憶體模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單執行緒程式的執行,卻會影響到多執行緒並發執行的正確性。
在Java裡面,可以透過volatile關鍵字來確保一定的「有序性」(它能禁止進行指令重排序)。另外可以透過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個執行緒執行同步程式碼,相當於是讓執行緒順序執行同步程式碼,自然就保證了有序性。
另外,Java記憶體模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行順序無法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛擬機器可以隨意地對它們進行重新排序。
下面就來具體介紹下happens-before原則(先行發生原則):
程式次序規則:一個執行緒內,依照程式碼順序,書寫在前面的操作先行發生於書寫在後面的操作
#鎖定規則:一個unLock操作先行發生於後面對同一個鎖額lock操作
volatile變數規則:對一個變數的寫入操作先行發生於後面對這個變數的讀取操作
傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C
#執行緒啟動規則:Thread物件的start()方法先行發生於此執行緒的每個一個動作
線程中斷規則:對線程interrupt()方法的呼叫先行發生於被中斷線程的程式碼偵測到中斷事件的發生
執行緒終結規則:執行緒中所有的操作都先行發生於執行緒的終止偵測,我們可以透過Thread.join()方法結束、Thread.isAlive()的回傳值手段偵測到執行緒已經終止執行
物件終結規則:一個物件的初始化完成先行發生於他的finalize()方法的開始
這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。
下面我們來解釋一下前4條規則:
對於程式次序規則來說,我的理解就是一段程式碼的執行在單一執行緒中看起來是有序的。請注意,雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”,這個應該是程式看起來執行的順序是按照程式碼順序執行的,因為虛擬機可能會對程式碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程式順序執行的結果一致的,它只會對不存在資料依賴性的指令進行重排序。因此,在單一執行緒中,程式執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程式在單一執行緒中執行結果的正確性,但無法保證程式在多執行緒中執行的正確性。
第二條規則也比較容易理解,也就是說無論在單執行緒還是多執行緒中,同一個鎖如果出於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。
第三條規則是一條比較重要的規則,也是後文將要重點講述的內容。直觀地解釋就是,如果一個執行緒先去寫一個變量,然後一個執行緒去進行讀取,那麼寫入操作肯定會先行發生於讀取操作。
第四條規則其實就是體現happens-before原則具備傳遞性。
一旦一個共享變數(類別的成員變數、類的靜態成員變數)被volatile修飾之後,那麼就具備了兩層語意:
#保證了不同執行緒對這個變數進行操作時的可見性,即一個執行緒修改了某個變數的值,這新值對其他執行緒來說是立即可見的。
禁止進行指令重新排序。
關於可見性,先看一段程式碼,假如線程1先執行,線程2後執行:
//线程1 boolean stop = false; while(!stop){ doSomething(); } //线程2 stop = true;
這段程式碼是很典型的一段程式碼,很多人在中斷執行緒時可能都會採用這種標記辦法。但事實上,這段程式碼會完全運行正確麼?即一定會將線程中斷麼?不一定,也許在大多數時候,這個程式碼能夠把線程中斷,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是只要一旦發生這種情況就會造成死循環了)。
下面說明這段程式碼為何有可能導致無法中斷執行緒。在前面已經解釋過,每個線程在運行過程中都有自己的工作內存,那麼線程1在運行的時候,會將stop變量的值拷貝一份放在自己的工作內存當中。
那麼當線程2更改了stop變數的值之後,但是還沒來得及寫入主存當中,線程2轉去做其他事情了,那麼線程1由於不知道線程2對stop變數的更改,因此還會一直循環下去。
但是用volatile修飾之後就變得不一樣了:
第一:使用volatile關鍵字會強制將修改的值立即寫入主記憶體;
第二:使用volatile關鍵字的話,當執行緒2進行修改時,會導致執行緒1的工作記憶體中快取變數stop的快取行無效(反映到硬體層的話,就是CPU的L1或L2快取中對應的快取行無效);
第三:由於執行緒1的工作記憶體中快取變數stop的快取行無效,所以執行緒1再次讀取變數stop的值時會去主記憶體讀取。
那麼在線程2修改stop值時(當然這裡包含2個操作,修改線程2工作記憶體中的值,然後將修改後的值寫入記憶體),會使得執行緒1的工作記憶體中快取變數stop的快取行無效,然後執行緒1讀取時,發現自己的快取行無效,它會等待快取行對應的主存位址被更新之後,然後去對應的主記憶體讀取最新的值。
那麼執行緒1讀取到的就是最新的正確的值。
volatile不保證原子性,下面看一個實例。
public class Test { public volatile int inc = 0; public void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保证前面的线程都执行完 Thread.yield(); System.out.println(test.inc); } }
大家想一下這段程式的輸出結果是多少?也許有些朋友認為是10000。但事實上運行它會發現每次運行結果都不一致,都是一個小於10000的數字。
這裡面就有一個誤解了,volatile關鍵字能保證可見性沒有錯,但是上面的程式錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變數的操作的原子性。
在前面已經提到過,自增操作是不具備原子性的,它包括讀取變數的原始值、進行加1操作、寫入工作記憶體。那麼就是說自增操作的三個子操作可能會分割開執行,就有可能導致下面這種情況出現:
假如某個時刻變數inc的值為10。
線程1對變數進行自增操作,線程1先讀取了變數inc的原始值,然後線程1被阻塞了;
然後線程2對變數進行自增操作,線程2也去讀取變數inc的原始值,由於線程1只是對變數inc進行讀取操作,而沒有對變數進行修改操作,所以不會導致線程2的工作記憶體中快取變數inc的快取行無效,所以線程2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,並把11寫入工作內存,最後寫入主存。
然後線程1接著進行加1操作,由於已經讀取了inc的值,注意此時在線程1的工作內存中inc的值仍然為10,所以線程1對inc進行加1操作後inc的值為11,然後將11寫入工作內存,最後寫入主存。
那麼兩個執行緒分別進行了一次自增操作後,inc只增加了1。
解釋到這裡,可能有朋友會有疑問,不對啊,前面不是保證一個變數在修改volatile變數時,會讓快取行無效嗎?然後其他線程去讀就會讀到新的值,對,這個沒錯。這個就是上面的happens-before規則中的volatile變數規則,但是要注意,線程1對變數進行讀取操作之後,被阻塞了的話,並沒有對inc值進行修改。然後雖然volatile能保證線程2對變數inc的值讀取是從記憶體讀取的,但是線程1沒有進行修改,所以線程2根本就不會看到修改的值。
根源就在这里,自增操作不是原子性操作,而且volatile也无法保证对变量的任何操作都是原子性的。
把上面的代码改成以下任何一种都可以达到效果:
采用synchronized:
public class Test { public int inc = 0; public synchronized void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保证前面的线程都执行完 Thread.yield(); System.out.println(test.inc); } }
采用Lock:
public class Test { public int inc = 0; Lock lock = new ReentrantLock(); public void increase() { lock.lock(); try { inc++; } finally{ lock.unlock(); } } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保证前面的线程都执行完 Thread.yield(); System.out.println(test.inc); } }
采用AtomicInteger:
public class Test { public AtomicInteger inc = new AtomicInteger(); public void increase() { inc.getAndIncrement(); } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) //保证前面的线程都执行完 Thread.yield(); System.out.println(test.inc); } }
在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作类,即对基本数据类型的 自增(加1操作),自减(减1操作)、以及加法操作(加一个数),减法操作(减一个数)进行了封装,保证这些操作是原子性操作。atomic是利用CAS来实现原子性操作的(Compare And Swap),CAS实际上是利用处理器提供的CMPXCHG指令实现的,而处理器执行CMPXCHG指令是一个原子性操作。
volatile能在一定程度上保证有序性。
volatile关键字禁止指令重排序有两层意思:
1)当程序执行到volatile变量的读操作或者写操作时,在其前面的操作的更改肯定全部已经进行,且结果已经对后面的操作可见;在其后面的操作肯定还没有进行;
2)在进行指令优化时,不能将在对volatile变量访问的语句放在其后面执行,也不能把volatile变量后面的语句放到其前面执行。
举个例子:
//x、y为非volatile变量 //flag为volatile变量 x = 2; //语句1 y = 0; //语句2 flag = true; //语句3 x = 4; //语句4 y = -1; //语句5
由于flag变量为volatile变量,那么在进行指令重排序的过程的时候,不会将语句3放到语句1、语句2前面,也不会讲语句3放到语句4、语句5后面。但是要注意语句1和语句2的顺序、语句4和语句5的顺序是不作任何保证的。
并且volatile关键字能保证,执行到语句3时,语句1和语句2必定是执行完毕了的,且语句1和语句2的执行结果对语句3、语句4、语句5是可见的。
这里探讨一下volatile到底如何保证可见性和禁止指令重排序的。
下面这段话摘自《深入理解Java虚拟机》:
“观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现,加入volatile关键字时,会多出一个lock前缀指令”
lock前缀指令实际上相当于一个内存屏障(也成内存栅栏),内存屏障会提供3个功能:
它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置,也不会把前面的指令排到内存屏障的后面;即在执行到内存屏障这句指令时,在它前面的操作已经全部完成;
它会强制将对缓存的修改操作立即写入主存;
如果是写操作,它会导致其他CPU中对应的缓存行无效。
synchronized关键字是防止多个线程同时执行一段代码,那么就会很影响程序执行效率,而volatile关键字在某些情况下性能要优于synchronized,但是要注意volatile关键字是无法替代synchronized关键字的,因为volatile关键字无法保证操作的原子性。通常来说,使用volatile必须具备以下2个条件:
对变量的写操作不依赖于当前值(比如++操作,上面有例子)
该变量没有包含在具有其他变量的不变式中
实际上,这些条件表明,可以被写入 volatile 变量的这些有效值独立于任何程序的状态,包括变量的当前状态。
事实上,我的理解就是上面的2个条件需要保证操作是原子性操作,才能保证使用volatile关键字的程序在并发时能够正确执行。
下面列举几个Java中使用volatile的几个场景。
状态标记量
volatile boolean flag = false; while(!flag){ doSomething(); } public void setFlag() { flag = true; }
volatile boolean inited = false; //线程1: context = loadContext(); inited = true; //线程2: while(!inited ){ sleep() } doSomethingwithconfig(context);
double check
class Singleton{ private volatile static Singleton instance = null; private Singleton() { } public static Singleton getInstance() { if(instance==null) { synchronized (Singleton.class) { if(instance==null) instance = new Singleton(); } } return instance; } }
至于为何需要这么写请参考:
以上是從根源解析Java volatile關鍵字實現的範例程式碼(圖)的詳細內容。更多資訊請關注PHP中文網其他相關文章!