如果你是一名 Java 開發(fā)人員,你肯定指定 Java 代碼有很多種不同的運(yùn)行方式。比如說可以在開發(fā)工具(IDEA、Eclipse等)中運(yùn)行,可以雙擊執(zhí)行
jar 文件運(yùn)行,也可以在命令行中運(yùn)行,甚至可以在網(wǎng)頁(比如各種 OJ)中運(yùn)行。當(dāng)然,這些執(zhí)行方式都離不開 JRE(Java 運(yùn)行時環(huán)境)。
JRE 包含運(yùn)行 Java 程序的必需組件,包括 JVM(Java 虛擬機(jī))以及 Java 核心類庫等。Java 程序員經(jīng)常接觸到的 JDK(Java
開發(fā)工具包)同樣包含了 JRE,并且還附帶了一系列開發(fā)、診斷工具。
本篇文章主要針對以下兩個問題和大家一起探討:
* 為什么需要 JVM?
* JVM 是怎樣運(yùn)行 Java 代碼的呢?
為什么需要 JVM?
Java 的一個非常重要的特點(diǎn)就是與平臺的無關(guān)性,而使用 JVM 是實(shí)現(xiàn)這一特點(diǎn)的關(guān)鍵。Java
作為一門高級程序語言,語法復(fù)雜,抽象程度高。因此,直接在硬件上運(yùn)行這種復(fù)雜的程序并不現(xiàn)實(shí)。所以在運(yùn)行 Java 程序之前,我們需要對其進(jìn)行轉(zhuǎn)換。
設(shè)計一個面向 Java 語言特性的虛擬機(jī),并通過編譯器將 Java 程序轉(zhuǎn)換成該虛擬機(jī)所能識別的指令序列(因?yàn)?Java
字節(jié)碼指令的操作碼(opcode)被固定為一個字節(jié),故又稱 Java 字節(jié)碼)。
JVM 一般是在各個現(xiàn)有平臺(如 Windows、Linux)上提供軟件實(shí)現(xiàn),這樣可以使一旦一個程序被轉(zhuǎn)換成 Java
字節(jié)碼,那么便可以在不同平臺上的虛擬機(jī)實(shí)現(xiàn)里運(yùn)行(一次編寫,到處運(yùn)行)。
JVM 另外一個好處是帶有托管環(huán)境(Managed
Runtime),托管環(huán)境能夠代替處理一些代碼中冗長而且容易出錯的部分,其中包括自動內(nèi)存管理與垃圾回收(GC)。
另外,托管環(huán)境還提供了諸如數(shù)組越界、動態(tài)類型、安全權(quán)限等等的動態(tài)檢測,使我們免于書寫這些無關(guān)業(yè)務(wù)邏輯的代碼。
JVM 是怎樣運(yùn)行 Java 代碼的呢?
JVM 具體是怎么運(yùn)行 Java 字節(jié)碼的呢?下面我們一起來看一下:
從 JVM 來看,執(zhí)行 Java 代碼首先需要將它編譯而成的 class 文件加載到 JVM 中。加載后的 Java 類會被存放于方法區(qū)(Method
Area)中。實(shí)際運(yùn)行時,JVM 會執(zhí)行方法區(qū)內(nèi)的代碼。
JVM 會在內(nèi)存中劃分出堆和棧來存儲運(yùn)行時數(shù)據(jù),JVM 會將棧細(xì)分為面向 Java 方法的 Java 方法棧,面向本地方法(用 C++ 寫的 native
方法)的本地方法棧,以及存放各個線程執(zhí)行位置的 PC 寄存器。
在運(yùn)行過程中,每當(dāng)調(diào)用進(jìn)入一個 Java 方法,JVM 會在當(dāng)前線程的 Java
方法棧中生成一個棧幀,用以存放局部變量以及字節(jié)碼的操作數(shù)。棧幀的大小是提前計算好的,而且 JVM 不要求棧幀在內(nèi)存空間里連續(xù)分布。
當(dāng)退出當(dāng)前執(zhí)行的方法時,不管是正常返回還是異常返回,JVM 均會彈出當(dāng)前線程的當(dāng)前棧幀,并將之舍棄。
從硬件視角來看,Java 字節(jié)碼無法直接執(zhí)行。因此,JVM 需要將字節(jié)碼翻譯成機(jī)器碼。
在 HotSpot
里面,上述翻譯過程有兩種形式:第一種是解釋執(zhí)行(interpreter),即逐條將字節(jié)碼翻譯成機(jī)器碼并執(zhí)行;第二種是即時編譯(Just-In-Time
compilation,JIT),即將一個方法中包含的所有字節(jié)碼編譯成機(jī)器碼后再執(zhí)行。
前者的優(yōu)勢在于無需等待編譯,而后者的優(yōu)勢在于實(shí)際運(yùn)行速度更快。HotSpot
默認(rèn)采用混合模式,綜合了解釋執(zhí)行和即時編譯兩者的優(yōu)點(diǎn)。它會先解釋執(zhí)行字節(jié)碼,而后將其中反復(fù)執(zhí)行的熱點(diǎn)代碼,以方法為單位進(jìn)行即時編譯。
整個 Java 代碼執(zhí)行過程如下:
* 使用 javac 把 .java 源文件編譯為字節(jié)碼(文件后綴名為 .class)
* 字節(jié)碼經(jīng)過 JIT 環(huán)境變量進(jìn)行判斷,是否屬于熱點(diǎn)代碼(多次調(diào)用的方法或循環(huán)體)
* 熱點(diǎn)代碼使用 JIT 編譯為可執(zhí)行的機(jī)器碼
* 非熱點(diǎn)代碼使用解釋器解釋執(zhí)行所有字節(jié)碼
其中,在運(yùn)行過程中會被即時編譯的熱點(diǎn)代碼有兩類:
* 被多次調(diào)用的方法
* 被多次執(zhí)行的循環(huán)體
針對第一類,編譯器會將整個方法作為編譯對象,這也是標(biāo)準(zhǔn)的 JIT
編譯方式。對于第二類是由循環(huán)體出發(fā)的,但是編譯器依然會以整個方法作為編譯對象,因?yàn)榘l(fā)生在方法執(zhí)行過程中,稱為棧上替換。
HotSpot 采用了多種技術(shù)來提升啟動性能以及峰值性能,剛剛提到的即時編譯便是其中最重要的技術(shù)之一。
即時編譯建立在程序符合二八定律的假設(shè)上,也就是百分之二十的代碼占據(jù)了百分之八十的計算資源。
對于占據(jù)大部分的不常用的代碼,我們無需耗費(fèi)時間將其編譯成機(jī)器碼,而是采取解釋執(zhí)行的方式運(yùn)行;另一方面,對于僅占據(jù)小部分的熱點(diǎn)代碼,我們則可以將其編譯成機(jī)器碼,以達(dá)到理想的運(yùn)行速度。
為了滿足不同用戶場景的需要,HotSpot 內(nèi)置了多個即時編譯器:C1、C2。之所以引入多個即時編譯器,是為了在編譯時間和生成代碼的執(zhí)行效率之間進(jìn)行取舍。
* C1 (Client 編譯器)面向的是對啟動性能有要求的客戶端 GUI 程序,采用的優(yōu)化手段相對簡單,因此編譯時間較短。
* C2 (Server 編譯器)面向的是對峰值性能有要求的服務(wù)器端程序,采用的優(yōu)化手段相對復(fù)雜,因此編譯時間較長,但同時生成代碼的執(zhí)行效率較高。
從 Java 7 開始,HotSpot 默認(rèn)采用分層編譯的方式:熱點(diǎn)方法首先會被 C1 編譯,而后熱點(diǎn)方法中的熱點(diǎn)會進(jìn)一步被 C2 編譯。
為了不干擾應(yīng)用的正常運(yùn)行,HotSpot 的即時編譯是放在額外的編譯線程中進(jìn)行的。HotSpot 會根據(jù) CPU 的數(shù)量設(shè)置編譯線程的數(shù)目,并且按 1:2
的比例配置給 C1 及 C2 編譯器。
在計算資源充足的情況下,字節(jié)碼的解釋執(zhí)行和即時編譯可同時進(jìn)行。編譯完成后的機(jī)器碼會在下次調(diào)用該方法時啟用,以替換原本的解釋執(zhí)行。
其中判斷一段代碼是否為熱點(diǎn)代碼,是不是需要觸發(fā)即時編譯,這樣的行為稱為熱點(diǎn)探測(Hot Spot Detection),探測算法有兩種:
* 基于采樣的熱點(diǎn)探測(Sample Based Hot Spot
Detection):虛擬機(jī)會周期的對各個線程棧頂進(jìn)行檢查,如果某些方法經(jīng)常出現(xiàn)在棧頂,這個方法就是熱點(diǎn)方法。優(yōu)點(diǎn)是實(shí)現(xiàn)簡單、高效,很容易獲取方法調(diào)用關(guān)系。缺點(diǎn)是很難確認(rèn)方法的
reduce,容易受到線程阻塞或其他外因擾亂。
* 基于計數(shù)器的熱點(diǎn)探測(Counter Based Hot Spot
Detection):為每個方法(甚至是代碼塊)建立計數(shù)器,執(zhí)行次數(shù)超過閾值就認(rèn)為是熱點(diǎn)方法。優(yōu)點(diǎn)是統(tǒng)計結(jié)果精確嚴(yán)謹(jǐn)。缺點(diǎn)是實(shí)現(xiàn)麻煩,不能直接獲取方法的調(diào)用關(guān)系。
HotSpot 使用的是第二種-基于計數(shù)器的熱點(diǎn)探測,并且有兩類計數(shù)器:方法調(diào)用計數(shù)器(Invocation Counter)和回邊計數(shù)器(Back
Edge Counter)。
總結(jié)
這篇文章主要介紹了為什么需要 JVM 以及 JVM 是怎樣運(yùn)行 Java 代碼的。
為什么需要 JVM:
* 提供了可移植性。一次編譯,到處執(zhí)行。
* 提供了代碼托管的環(huán)境,代替處理部分冗長而且容易出錯的部分。
JVM 將運(yùn)行時內(nèi)存區(qū)域劃分為五個部分,分別為方法區(qū)、堆、PC 寄存器、Java 方法棧和本地方法棧。Java 程序編譯而成的 class
文件,需要先加載至方法區(qū)中,方能在 JVM 中運(yùn)行。
為了提高運(yùn)行效率,HotSpot 虛擬機(jī)采用的是一種混合執(zhí)行的策略,會解釋執(zhí)行 Java
字節(jié)碼,然后會將其中反復(fù)執(zhí)行的熱點(diǎn)代碼,以方法為單位進(jìn)行即時編譯,翻譯成機(jī)器碼后直接運(yùn)行在底層硬件之上。
HotSpot 裝載了多個不同的即時編譯器,以便在編譯時間和生成代碼的執(zhí)行效率之間做取舍。
判斷熱點(diǎn)代碼的探測算法包括基于采樣和基于計數(shù)器兩種,HotSpot 采用基于計數(shù)器的熱點(diǎn)探測,計數(shù)器又分為方法調(diào)用計數(shù)器和回邊計數(shù)器。
熱門工具 換一換