Java 编译期与运行期,别傻傻分不清楚!
來源:小小木的博客
www.cnblogs.com/wyc1994666/p/11366802.html
不知大家有沒有思考過,當(dāng)我們使用IDE寫了一個(gè)Demo類,并執(zhí)行main函數(shù)打印 hello world時(shí)都經(jīng)歷了哪些流程么?
想通過這篇文章來分析分析Java的執(zhí)行流程,或者換句話說想聊聊Java的編譯期與運(yùn)行期的流程。
-
開門見山
-
編譯期間都做了什么
-
運(yùn)行期間都做了什么
1. 開門見山
public?class?MyApp?{????public?static?void?main(String[]?args)?{System.out.println("hello?world");} }假如我們寫了一個(gè)MyApp.java,并要打印‘hello world’ 那它需要經(jīng)過哪些步驟?
第一步:compile
通過編譯器進(jìn)行編譯,從Java源碼 ---> Java 字節(jié)碼
這個(gè)編譯器則是jdk 里的javac 編譯器,我們只需 javac MyApp.java 即可以編譯該源碼,javac 編譯器位于jdk --> bin -->javac
第二步:load and execute
加載java 字節(jié)碼并執(zhí)行
可以通過jdk 里的java命令運(yùn)行java字節(jié)碼,我們只需 java MyApp.class 即可加載并執(zhí)行該字節(jié)碼,當(dāng)運(yùn)行java命令時(shí),JRE將與您指定的類一起加載。然后,執(zhí)行該類的main方法。
java命令位于jdk --> bin -->java。
上面只是大概講了運(yùn)行一個(gè)java程序的流程,下面再從編譯期以及運(yùn)行期的角度再剖析一下細(xì)節(jié)。
2. 編譯期間都做了什么?
編譯器(compiler)是一種計(jì)算機(jī)程序,它會(huì)將某種編程語言寫成的源代碼(原始語言)轉(zhuǎn)換成另一種編程語言(目標(biāo)語言)。
編譯期都做了什么?從我們使用者角度看無非就是把源代碼編譯成了可被虛擬機(jī)執(zhí)行的字節(jié)碼,但是從平臺(tái)(編譯器)角度看,它所經(jīng)歷的流程還不少。
畢竟總不能給你什么以.java為后綴的文件都進(jìn)行編譯吧,需要有各種校驗(yàn)解析步驟
2.1 解析與填充符號(hào)表
詞法語法分析
詞法分析是指把源代碼的字符流轉(zhuǎn)為標(biāo)記(Token)集合,標(biāo)記(Token)是編譯階段的最小單元,字符則是編程階段源碼的最小單元。
比如,int i = 0由4個(gè)標(biāo)記構(gòu)成分別是「int,i,=,0」編譯器只認(rèn)識(shí)這些標(biāo)記,詞法分析過程就是識(shí)別一個(gè)個(gè)標(biāo)記的過程
語法分析則是把生成的標(biāo)記集合?構(gòu)成一個(gè)語法樹,每個(gè)節(jié)點(diǎn)代表程序代碼中的語法結(jié)構(gòu),如包,類型,修飾符,運(yùn)算符等等。
填充符號(hào)表
通過了上面的詞義語義分析之后,我們需要把數(shù)據(jù)存起來,以供后續(xù)流程使用,編譯器會(huì)以key-value的形式存儲(chǔ)數(shù)據(jù),以符號(hào)地址為key,符號(hào)信息為value,具體形式?jīng)]做限制,可以是樹狀符號(hào)表或者有序符號(hào)表等。
在語義分析中,根據(jù)符號(hào)表所登記的內(nèi)容,語義檢查和產(chǎn)生中間代碼,在目標(biāo)代碼生成階段,當(dāng)對(duì)符號(hào)表進(jìn)行地址分配時(shí),該符號(hào)表是檢查的依據(jù)。
2.2 注解處理器
注解與普通的Java代碼一樣,是在運(yùn)行期間發(fā)揮作用的。我們可以把它看做是一組編譯器的插件,在這些插件里面,可以讀取、修改、添加抽象語法樹中的任意元素。
如果這些插件在處理注解期間對(duì)語法樹進(jìn)行了修改,編譯器將回到解析及填充符號(hào)表的過程重新處理,直到所有插入式注解處理器都沒有再對(duì)語法樹進(jìn)行修改為止。
換句話說當(dāng)我們處理注解時(shí),如果修改了語法樹的話,會(huì)重新執(zhí)行分析以及符號(hào)填充過程,把注解也填充進(jìn)來,直到處理完所有注解。
2.3 語義分析
語法分析以及處理注解之后,編譯器獲得了程序代碼的抽象語法樹,語法樹能表示一個(gè)結(jié)構(gòu)正確的源程序的抽象,但無法保證源程序是符合邏輯的。
說白了,語法樹上的內(nèi)容單個(gè)來說是合法的,但是結(jié)合到上下文語義則未必是合法的。
比如定義了兩個(gè)變量
int?a?=?1;? boolean?b?=?false; int?c?=?a?+?b以上, 都能構(gòu)成結(jié)構(gòu)正確的語法樹,但是根據(jù)語義分析之后編譯是通不過的,Java語言中是不合乎邏輯的。
2.4 解語法糖
Java 中最常用的語法糖主要有泛型、變長參數(shù)、條件編譯、自動(dòng)拆裝箱、內(nèi)部類等。虛擬機(jī)并不支持這些語法,它們?cè)诰幾g階段就被還原回了簡(jiǎn)單的基礎(chǔ)語法結(jié)構(gòu),這個(gè)過程成為解語法糖。
換句話說,不論你是否使用Java的語法糖,最終到j(luò)vm那里的時(shí)候都是一樣的,jvm不支持語法糖,所以需要編譯階段解語法糖,語法糖的初衷是用來提升開發(fā)效率,而不是代碼性能。
2.5 字節(jié)碼生成
字節(jié)碼生成是Javac編譯過程的最后一個(gè)階段,在Javac源碼里面由com.sun.tools.javac. jvm.Gen類來完成。
字節(jié)碼生成階段前面各個(gè)步驟所生成的信息(語法樹、符號(hào)表)轉(zhuǎn)化成字節(jié)碼寫到磁盤中,主要工作就是把語法樹和符號(hào)表加工成字節(jié)碼文件。
3. 運(yùn)行期間都做了什么?
java的運(yùn)行期主要是處理編譯器產(chǎn)生的字節(jié)碼,包括加載與執(zhí)行。
3.1 加載器與驗(yàn)證器
java提供類加載器把虛擬機(jī)外部的字節(jié)碼資源載入到虛擬機(jī)的運(yùn)行時(shí)環(huán)境(主要是指虛擬機(jī)的方法區(qū))并提供字節(jié)碼驗(yàn)證器來保證載入的字節(jié)碼是安全合法的,對(duì)程序沒有危害的。
加載器 (Class Loader)
當(dāng)字節(jié)碼還沒被類加載器加載之前,它目前還處于虛擬機(jī)外部存儲(chǔ)空間里,要想執(zhí)行它需要通過類加載器來加載到虛擬機(jī)的運(yùn)行時(shí)內(nèi)存空間里。關(guān)于類加載器不太想過多擴(kuò)展,有興趣可查閱相關(guān)書籍資料。
常見類加載器有:
-
Bootstrap ClassLoader(啟動(dòng)類加載器:加載位于<JAVA_HOME>\lib 目錄下的類文件,如rt.jar
-
Extension ClassLoader(擴(kuò)展類加載器): 加載位于<JAVA_HOME>\lib\ext目錄下的類文件
-
Application ClassLoader(應(yīng)用程序類加載器):加載位于類路徑(ClassPath)下的類文件
總之,加載器的任務(wù)就是把字節(jié)碼資源載入到虛擬機(jī)運(yùn)行時(shí)環(huán)境里。
字節(jié)碼驗(yàn)證 (Bytecode Verifier)
當(dāng)類加載器將新加載的字節(jié)碼呈現(xiàn)給虛擬機(jī)時(shí),首先由驗(yàn)證器來檢查驗(yàn)證這些字節(jié)碼。驗(yàn)證程序檢查指令是否無法執(zhí)行明顯有害的操作。除系統(tǒng)類之外的所有類都需要經(jīng)過驗(yàn)證。也可以使用命令-noverify選項(xiàng)來停用驗(yàn)證。
字節(jié)碼驗(yàn)證器主要驗(yàn)證如下幾項(xiàng):
- 變量在使用前初始化
- 不違反訪問私有數(shù)據(jù)和方法的規(guī)則
- 運(yùn)行時(shí)堆棧不會(huì)溢出
- 所有Java虛擬機(jī)指令的參數(shù)都是有效類型
- 各種類型檢查
參考 http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10。
總之,驗(yàn)證器的任務(wù)就是保證加載器載入的字節(jié)碼資源的安全性,正確性
3.2 解釋器與JIT編譯器
解釋器
解釋器(interpreter),是一種計(jì)算機(jī)程序,能夠把高級(jí)編程語言一行一行解釋?運(yùn)行。
劃重點(diǎn):一行一行運(yùn)行,說白了就是效率低
解釋器每次運(yùn)行程序時(shí)都要一行一行先轉(zhuǎn)成另一種語言再作運(yùn)行,因此解釋器的程序運(yùn)行速度比較緩慢。它不會(huì)一次把整段代碼翻譯出來,而是每翻譯一行程序敘述就立刻運(yùn)行,然后再翻譯下一行,再運(yùn)行,如此不停地進(jìn)行下去。
JIT編譯器
即時(shí)編譯(Just-in-time compilation)是一種提高程序運(yùn)行效率的方法。通常,程序在執(zhí)行前全部被翻譯為機(jī)器碼。
Java最初的版本沒有JIT編譯器,完全靠解釋器來運(yùn)行的,但是為了提升性能便引入了JIT編譯器。
重點(diǎn)說明:當(dāng)我們說編譯的時(shí)候基本上指的是上面的從源碼到字節(jié)碼的編譯過程,而不是指JIT編譯器。
JIT編譯器工作階段基本是java程序運(yùn)行期的最后階段了,它的工作是將加載的字節(jié)碼轉(zhuǎn)換為機(jī)器碼。當(dāng)使用JIT編譯器時(shí),硬件可以執(zhí)行JIT編譯器生成的機(jī)器碼,而不是讓JVM重復(fù)解釋執(zhí)行相同的字節(jié)碼導(dǎo)致相對(duì)冗長的翻譯過程。這樣可以帶來執(zhí)行速度的性能提升。
什么時(shí)候觸發(fā)即時(shí)編譯?
-
被多次調(diào)用的方法
-
被多次執(zhí)行的循環(huán)體
上面兩個(gè)條件又叫做熱點(diǎn)代碼,至于如何界定這個(gè)多次或者熱點(diǎn),Java提供了兩種策略:
熱點(diǎn)探測(cè): 虛擬機(jī)定期檢查線程的棧頂,如果某個(gè)方法經(jīng)常出現(xiàn)在棧頂 則推斷為熱點(diǎn)代碼
計(jì)數(shù)器: 統(tǒng)計(jì)方法的調(diào)用次數(shù),維護(hù)一個(gè)計(jì)數(shù)器列表
基于計(jì)數(shù)器來推斷熱點(diǎn)代碼是HotSpot虛擬機(jī)采用的策略
通常情況下,解釋器和JIT編譯器混合配合工作,而不是單獨(dú)工作,這樣可以做到互補(bǔ)提升整體性能。HotSpot 虛擬機(jī)的解釋器JIT編譯器架構(gòu)如下圖所示:
HotSpot虛擬機(jī)中內(nèi)置了兩個(gè)即時(shí)編譯器,分別稱為Client Compiler和Server Compiler,或者簡(jiǎn)稱為C1編譯器和C2編譯器,默認(rèn)采用解釋器與其中一個(gè)編譯器直接配合的方式工作,程序使用哪個(gè)編譯器,取決于虛擬機(jī)運(yùn)行的模式,用戶也可以使用“-client”或“-server”參數(shù)去強(qiáng)制指定虛擬機(jī)運(yùn)行在Client模式或Server模式。
4. 總結(jié)
java 程序是如何運(yùn)行的?
首先需要把源代碼(高級(jí)語言) 編譯成虛擬機(jī)可執(zhí)行的語言(字節(jié)碼)
其次,需要把字節(jié)碼解釋運(yùn)行后者編譯成操作系統(tǒng)級(jí)別的機(jī)器語言,用于執(zhí)行函數(shù)調(diào)用(System call)
Java是如何做到平臺(tái)獨(dú)立的?
主要是因?yàn)樽止?jié)碼技術(shù)。我們可以把在Windows系統(tǒng)上編譯生成的字節(jié)碼文件放在Linux系統(tǒng)上去執(zhí)行,反之亦可。
虛擬機(jī)不在乎你是哪個(gè)操作系統(tǒng)生成的字節(jié)碼文件,他只在乎加載的這個(gè).class字節(jié)碼文件是否是正確的,安全的。
雖然Java語言是平臺(tái)獨(dú)立的,但是虛擬機(jī)不行。每種操作系統(tǒng)都要下載對(duì)應(yīng)的虛擬機(jī),這主要是由于它最終調(diào)用的函數(shù)庫以及線程模型不同。
參考:
1.http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10.
2.深入理解Java虛擬機(jī)
總結(jié)
以上是生活随笔為你收集整理的Java 编译期与运行期,别傻傻分不清楚!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 程序员高薪盛宴背后:程序员正在消失?
- 下一篇: 真强啊!建议每一位Java程序员都读读D