本文來自:曹勝歡部落格專欄。轉載請註明出處:http://blog.csdn.net/csh624366188
在以前的部落格裡面,我們介紹了在java領域中大部分的知識點,從最基礎的java最基本文法到SSH架構。這裡面應該包含了在java領域裡面的大部分內容了吧。但是,那些知識點是讓我們從一個應用的層面上瞭解了java,java程式真正底層的運行機制和一些底層虛擬機器的工作我們還不瞭解,雖然這些內容在我們真正的開發中幾乎用不到這些底層的東西,但對於我們對java的理解會有比較大的協助。尤其也對以後java開發中的效能最佳化有很大協助,可以使我們減少一些沒必要的記憶體浪費等好處。所以,從今天開始,我將和大家一起來學習一下java虛擬機器的內容。從底層開一下java的運行機制。
Java虛擬機器
Java虛擬機器(Java Virtual Machine) 簡稱JVM Java虛擬機器是一個想象中的機器,在實際的電腦上通過軟體類比來實現。Java虛擬機器有自己想象中的硬體,如處理器、堆棧、寄存器等,還具有相應的指令系統。下面我們就來看一下這幾部分比較重要的java虛擬機器的結構
JVM寄存器
所有的CPU均包含用於儲存系統狀態和處理器所需資訊的寄存器組。如果虛擬機器定義義較多的寄存器,便可以從中得到更多的資訊而不必對棧或記憶體進行訪問,這有利於提高運行速度。然而,如果虛擬機器中的寄存器比實際CPU的寄存器多,在實現虛擬機器時就會佔用處理器大量的時間來用常規儲存空間類比寄存器,這反而會降低虛擬機器的效率。針對這種情況,JVM只設定了4個最為常用的寄存器。它們是:pc程式計數器,optop運算元棧頂指標 ,frame當前執行環境指標, vars指向當前執行環境中第一個局部變數的指標, 所有寄存器均為32位。pc用於記錄程式的執行。optop,frame和vars用於記錄指向Java棧區的指標。
JVM棧結構
作為基於棧結構的電腦,Java棧是JVM儲存資訊的主要方法。當JVM得到一個java位元組碼應用程式後,便為該代碼中一個類的每一個方法建立一個棧架構,以儲存該方法的狀態資訊。每個棧架構套件括以下三類資訊:局部變數執行環境運算元棧 局部變數用於儲存一個類的方法中所用到的局部變數。vars寄存器指向該變數表中的第一個局部變數。執行環境用於儲存解譯器對Java位元組碼進行解釋過程中所需的資訊。它們是:上次調用的方法、局部變數指標和運算元棧的棧頂和棧底指標。執行環境是一個執行一個方法的控制中心。例如:如果解譯器要執行iadd(整數加法),首先要從frame寄存器中找到當前執行環境,而後便從執行環境中找到運算元棧,從棧頂彈出兩個整數進行加法運算,最後將結果壓入棧頂。 運算元棧用於儲存運算所需運算元及運算的結果。
JVM片段回收堆
Java類的執行個體所需的儲存空間是在堆上分配的。解譯器具體承擔為類執行個體分配空間的工作。解譯器在為一個執行個體分配完儲存空間後,便開始記錄對該執行個體所佔用的記憶體地區的使用。一旦對象使用完畢,便將其回收到堆中。在Java語言中,除了new語句外沒有其他方法為一對象申請和釋放記憶體。對記憶體進行釋放和回收的工作是由Java運行系統承擔的。這允許Java運行系統的設計者自己決定片段回收的方法。在SUN公司開發的Java解譯器和Hot Java環境中,片段回收用後台線程的方式來執行。這不但為運行系統提供了良好的效能,而且使程式設計人員擺脫了自己控制記憶體使用量的風險。
JVM儲存區
JVM有兩類儲存區:常量緩衝池和方法區。常量緩衝池用於儲存類名稱、方法和欄位名稱以及串常量。方法區則用於儲存Java方法的位元組碼。對於這兩種儲存地區具體實現方式在JVM規格中沒有明確規定。這使得Java應用程式的儲存布局必須在運行過程中確定,依賴於具體平台的實現方式。JVM是為Java位元組碼定義的一種獨立於具體平台的規格描述,是Java平台獨立性的基礎。目前的JVM還存在一些限制和不足,有待於進一步的完善,但無論如何,JVM的思想是成功的。對比分析:如果把Java原程式想象成我們的C++原程式,Java原程式編譯後產生的位元組碼就相當於C++原程式編譯後的80x86的機器碼(二進位程式檔案),JVM虛擬機器相當於80x86電腦系統,Java解譯器相當於80x86CPU。在80x86CPU上啟動並執行是機器碼,在Java解譯器上啟動並執行是Java位元組碼。 Java解譯器相當於運行Java位元組碼的“CPU”,但該“CPU”不是通過硬體實現的,而是用軟體實現的。Java解譯器實際上就是特定的平台下的一個應用程式。只要實現了特定平台下的解譯器程式,Java位元組碼就能通過解譯器程式在該平台下運行,這是Java跨平台的根本。當前,並不是在所有的平台下都有相應Java解譯器程式,這也是Java並不能在所有的平台下都能啟動並執行原因,它只能在已實現了Java解譯器程式的平台下運行。
Java虛擬機器的體繫結構圖
Java虛擬機器從啟動到結束的生命週期,當java虛擬機器啟動後,在如下幾種情況下,Java虛擬機器將結束生命週期:
1.執行了System.exit()方法
2.程式正常執行結束
3.程式在執行過程中遇到了異常或錯誤而異常終止
4.由於作業系統出現錯誤而導致Java虛擬機器進程終止
Java虛擬機器的棧有三個地區:局部變數區、運行環境區、運算元區。
局部變數區
每個Java方法使用一個固定大小的局部變數集。它們按照與vars寄存器的字位移量來定址。局部變數都是32位的。長整數和雙精確度浮點數佔據了兩個局部變數的空間,卻按照第一個局部變數的索引來定址。(例如,一個具有索引n的局部變數,如果是一個雙精確度浮點數,那麼它實際佔據了索引n和n+1所代表的儲存空間)虛擬機器規範並不要求在局部變數中的64位的值是64位對齊的。虛擬機器提供了把局部變數中的值裝載到運算元棧的指令,也提供了把運算元棧中的值寫入局部變數的指令。
運行環境區
在運行環境中包含的資訊用於動態連結,正常的方法返回以及異常捕捉。
運算元棧區
機器指令只從運算元棧中取運算元,對它們進行操作,並把結果返回到棧中。選擇棧結構的原因是:在只有少量寄存器或非通用寄存器的機器(如Intel486)上,也能夠高效地類比虛擬機器的行為。運算元棧是32位的。它用於給方法傳遞參數,並從方法接收結果,也用於支援操作的參數,並儲存操作的結果。例如,iadd指令將兩個整數相加。相加的兩個整數應該是運算元棧頂的兩個字。這兩個字是由先前的指令壓進堆棧的。這兩個整數將從堆棧彈出、相加,並把結果壓回到運算元棧中。
每個未經處理資料類型都有專門的指令對它們進行必須的操作。每個運算元在棧中需要一個儲存位置,除了long和double型,它們需要兩個位置。運算元只能被適用於其類型的操作符所操作。例如,壓入兩個int類型的數,如果把它們當作是一個long類型的數則是非法的。在Sun的虛擬機器實現中,這個限制由位元組碼驗證器強制實行。但是,有少數操作(操作符dupe和swap),用於對運行時資料區進行操作時是不考慮類型的。
本地方法棧,當一個線程調用本地方法時,它就不再受到虛擬機器關於結構和安全限制方面的約束,它既可以訪問虛擬機器的運行期資料區,也可以使用本地處理器以及任何類型的棧。例如,本地棧是一個C語言的棧,那麼當C程式調用C函數時,函數的參數以某種順序被壓入棧,結果則返回給調用函數。在實現Java虛擬機器時,本地方法介面使用的是C語言的模型棧,那麼它的本地方法棧的調度與使用則完全與C語言的棧相同。
可以表示出來java程式啟動並執行一個全過程
3 Java虛擬機器的運行過程
上面對虛擬機器的各個部分進行了比較詳細的說明,下面通過一個具體的例子來分析它的運行過程。
虛擬機器通過調用某個指定類的方法main啟動,傳遞給main一個字串數組參數,使指定的類被裝載,同時連結該類所使用的其它的類型,並且初始化它們。例如對於程式:
class HelloApp
{
public static void main(String[] args)
{
System.out.println("Hello World!");
for (int i = 0; i < args.length; i++ )
{
System.out.println(args[i]);
}
}
}
編譯後在命令列模式下鍵入: java HelloApp run virtual machine
將通過調用HelloApp的方法main來啟動java虛擬機器,傳遞給main一個包含三個字串"run"、"virtual"、"machine"的數組。現在我們略述虛擬機器在執行HelloApp時可能採取的步驟。
開始試圖執行類HelloApp的main方法,發現該類並沒有被裝載,也就是說虛擬機器當前不包含該類的二進位代表,於是虛擬機器使用ClassLoader試圖尋找這樣的二進位代表。如果這個進程失敗,則拋出一個異常。類被裝載後同時在main方法被調用之前,必須對類HelloApp與其它類型進行連結然後初始化。連結包含三個階段:檢驗,準備和解析。檢驗檢查被裝載的主類的符號和語義,準備則建立類或介面的靜態域以及把這些域初始化為標準的預設值,解析負責檢查主類對其它類或介面的符號引用,在這一步它是可選的。類的初始化是對類中聲明的靜態初始化函數和靜態域的初始化構造方法的執行。一個類在初始化之前它的父類必須被初始化。整個過程如下:
推薦閱讀(內含jvm記憶體地區說明):
Java程式員從笨鳥到菜鳥之(九十三)深入java虛擬機器(二)——類載入器詳解(上)
參考資料:http://www.kuqin.com/java/20080525/8907.html