簡述
眾所周知java.exe是java class檔案的執行程式,但實際上java.exe程式只是
一個執行的外殼,它會裝載jvm.dll(windows下,以下皆以windows平台為例,
linux下和solaris下其實類似,為:libjvm.so),這個動態串連庫才是java
虛擬機器的實際操作處理所在。本文探究java.exe程式是如何尋找和裝載jvm.dll
動態庫,並調用它進行class檔案執行處理的。
原始碼
本文分析之代碼,《JavaTM 2 SDK, Standard Edition, v1.4.2 fcs
Community Source Release》,可從sun官方網站下載,主要分析的原始碼為:
j2se/src/share/bin/java.c
j2se/src/windows/bin/java_md.c
java.c是什麼東西
‘java程式’原始碼
所謂‘java程式’,包括jdk中的java.exe/javac.exe/javadoc.exe,java.c源
代碼中通過JAVA_ARGS宏來控制產生的程式碼,如果該宏沒定義則編譯檔案控制生
成java.exe否則編譯檔案控制產生其他的‘java程式’。
比如:
j2se/make/java/javac/Makefile(這是javac編譯檔案)中:
$(CD) ../../sun/javac ; $(MAKE) $@ RELEASE=$(RELEASE) FULL_VERSION=$(FULL_VERSION)
j2se/make/sun/javac/javac/Makefile(由上面Makefile檔案調用)中:
JAVA_ARGS = "{ /"-J-ms8m/", /"com.sun.tools.javac.Main/" }"
則由同一份java.c代碼產生的javac.exe程式就會直接調用java類方法:
com.sun.tools.javac.Main,這樣使其執行起來就像是直接啟動並執行一個exe檔案,
而未定義JAVA_ARGS的java.exe程式則會調用傳遞過來參數中的類方法。
從java.c的main入口函數說起
main()函數中前面一段為重新分配參數指標的處理。
然後調用函數:CreateExecutionEnvironment,該函數主要尋找java運行環境的
目錄,和jvm.dll這個虛擬機器核心動態串連庫檔案路徑所在。根據作業系統不同,
該函數有不同實現版本,但大體處理邏輯相同,我們看看windows平台該函數的處
理(j2se/src/windows/bin/java_md.c)。
CreateExecutionEnvironment函數主要分為三步處理:
a、尋找jre路徑。
b、裝載jvm.cfg中指定的虛擬機器動態串連庫(jvm.dll)參數。
c、取jvm.dll檔案路徑。
實現:
a、尋找jre路徑是通過java_md.c中函數:GetJREPath實現的。
該函數首先調用GetApplicationHome函數,GetApplicationHome函數調用windows
API函數GetModuleFileName取java.exe程式的絕對路徑,以我的jdk安裝路徑為例,
為:“D:/java/j2sdk1.4.2_04/bin/java.exe”,然後去掉檔案名稱取絕對路徑為:
“D:/java/j2sdk1.4.2_04/bin”,之後會在去掉最後一級目錄,現在絕對路徑為:
“D:/java/j2sdk1.4.2_04”。
然後GetJREPath函數繼續判斷剛剛取的路徑+/bin/java.dll組合成的這個java.dll
檔案是否存在,如果存在則“D:/java/j2sdk1.4.2_04”為JRE路徑,否則判斷取得
的“D:/java/j2sdk1.4.2_04”路徑+/jre/bin/java.dll檔案是否存在,存在則
“D:/java/j2sdk1.4.2_04/jre”為JRE路徑。如果上面兩種情況都不存在,則從注
冊表中去尋找(參見函數GetPublicJREHome)。
函數:GetPublicJREHome先尋找
HKEY_LOCAL_MACHINE/Software/JavaSoft/Java Runtime Environment/CurrentVersion
索引值“當前JRE版本號碼”,判斷“當前JRE版本號碼”是否為1.4做為版本號碼,如果是則
取HKEY_LOCAL_MACHINE/Software/JavaSoft/Java Runtime Environment/“當前JRE版本號碼”
/JavaHome的路徑所在為JRE路徑。
我的JDK返回的JRE路徑為:“D:/java/j2sdk1.4.2_04/jre”。
b、裝載jvm.cfg虛擬機器動態串連庫設定檔是通過java.c中函數:ReadKnownVMs實現
的。
該函數首先組合jvm.cfg檔案的絕對路徑,JRE路徑+/lib+/ARCH(CPU構架)+/jvm.cfg
ARCH(CPU構架)的判斷是通過java_md.c中GetArch函數判斷的,該函數中windows平
台只有兩種情況:WIN64的‘ia64’,其他情況都為‘i386’。我的為i386所以jvm.cfg
檔案絕對路徑為:“D:/java/j2sdk1.4.2_04/jre/lib/i386/jvm.cfg”。檔案內容如
下:
#
# @(#)jvm.cfg 1.7 03/01/23
#
# Copyright 2003 Sun Microsystems, Inc. All rights reserved.
# SUN PROPRIETARY/CONFIDENTIAL. Use is subject to license terms.
#
#
#
#
# List of JVMs that can be used as an option to java, javac, etc.
# Order is important -- first in this list is the default JVM.
# NOTE that this both this file and its format are UNSUPPORTED and
# WILL GO AWAY in a future release.
#
# You may also select a JVM in an arbitrary location with the
# "-XXaltjvm=<jvm_dir>" option, but that too is unsupported
# and may not be available in a future release.
#
-client KNOWN
-server KNOWN
-hotspot ALIASED_TO -client
-classic WARN
-native ERROR
-green ERROR
(如果細心的話,我們會發現在JDK目錄中我的為:“D:/java/j2sdk1.4.2_04/jre/bin/client”和“D:/java/j2sdk1.4.2_04/jre/bin/server”兩個目錄下都存在jvm.dll檔案。而java正是通過jvm.cfg設定檔來管理這些不同版本的jvm.dll的。)
ReadKnownVMs函數會將該檔案中的配置內容讀入到一個JVM配置結構的全域變數中,該函數首先跳過注釋(以‘#’開始的行),然後讀取以‘-’開始的行指定的jvm參數,每一行為一個jvm資訊,第一部分為jvm虛擬機器名稱,第二部分為配置參數,比如行:
“-client KNOWN”則“-client”為虛擬機器名稱,而“KNOWN”為配置型別參數,“KNOWN”
表示該虛擬機器的jvm.dll存在,而“ALIASED_TO”表示為另一個jvm.dll的別名,“WARN”
表示該虛擬機器的jvm.dll不存在但運行時會用其他存在的jvm.dll替代執行,而“ERROR”
同樣表示該類虛擬機器的jvm.dll不存在且運行時不會找存在的jvm.dll替代而直接拋出錯誤
資訊。
在運行java程式時指定使用那個虛擬機器的判斷是由java.c中函數:CheckJvmType判斷,該函數會檢查java運行參數中是否有指定jvm的參數,然後從ReadKnownVMs函數讀取的jvm.cfg資料結構中去尋找,從而指定不同的jvm類型(最終導致裝載不同jvm.dll)。有兩種方法可以指定jvm類型,一種按照jvm.cfg檔案中的jvm名稱指定,第二種方法是直接指定,它們執行的方法分別是“java -J<jvm.cfg中jvm名稱>”、“java -XXaltjvm=<jvm類型名稱>”或“java -J-XXaltjvm=<jvm類型名稱>”。如果是第一種參數傳遞方式,CheckJvmType函數會取參數‘-J’後面的jvm名稱,然後從已知的jvm配置參數中尋找如果找到同名的則去掉該jvm名稱前的‘-’直接返回該值;而第二種方法,會直接返回“-XXaltjvm=”或“-J-XXaltjvm=”後面的jvm類型名稱;如果在運行java時未指定上面兩種方法中的任一一種參數,CheckJvmType會取設定檔中第一個配置中的jvm名稱,去掉名稱前面的‘-’返回該值。CheckJvmType函數的這個傳回值會在下面的函數中匯同jre路徑組合成jvm.dll的絕對路徑。
比如:如果在運行java程式時使用“java -J-client test”則ReadKnownVMs會讀取參數“-client”然後尋找jvm.cfg讀入的參數中是否有jvm名稱為“-client”的,如果有則去掉jvm名稱前的“-”直接返回“client”;而如果在運行java程式時使用如下參數:
“java -XXaltjvm=D:/java/j2sdk1.4.2_04/jre/bin/client test”,則ReadKnownVMs
會直接返回“D:/java/j2sdk1.4.2_04/jre/bin/client”;如果不帶上面參數執行如:
“java test”,因為在jvm.cfg設定檔中第一個存在的jvm為“-client”,所以函數
ReadKnownVMs也會去掉jvm名稱前的“-”返回“client”。其實這三中情況都是使用的
“D:/java/j2sdk1.4.2_04/jre/bin/client/jvm.dll”這個jvm動態串連庫處理test這個class的,見下面GetJVMPath函數。
c、取jvm.dll檔案路徑是通過java_md.c中函數:GetJVMPath實現的。
由上面兩步我們已經獲得了JRE路徑和jvm的類型字串。GetJVMPath函數判斷CheckJvmType
返回的jvm類型字串中是否包含了‘/’或‘/’如果包含則以該jvm類型字串+/jvm.dll作為JVM的全路徑,否則以JRE路徑+/bin+/jvm類型字串+/jvm.dll作為JVM的全路徑。
看看上面的例子,第一種情況“java -J-client test”jvm.dll路徑為:
JRE路徑+/bin+/jvm類型字串+/jvm.dll 按照我的JDK路徑則為:
“D:/java/j2sdk1.4.2_04/jre”+“/bin”+“/client”+“/jvm.dll”。
第二種情況“java -XXaltjvm=D:/java/j2sdk1.4.2_04/jre/bin/client test”路徑為:
jvm類型字串+/jvm.dll即為:“D:/java/j2sdk1.4.2_04/jre/bin/client”+“/jvm.dll”
第三種情況“java test”為:“D:/java/j2sdk1.4.2_04/jre”+“/bin”+“/client”
+“/jvm.dll”與情況一相同。所以這三種情況都是調用的jvm動態串連庫“D:/java/
j2sdk1.4.2_04/jre/bin/client/jvm.dll”處理test類的。
我們來進一步驗證一下:
開啟cmd控制台:
設定java裝載調試
E:/work/java_research>set _JAVA_LAUNCHER_DEBUG=1
情況一
E:/work/java_research>java -J-client test.ScanDirectory
----_JAVA_LAUNCHER_DEBUG----
JRE path is D:/java/j2sdk1.4.2_04/jre
jvm.cfg[0] = ->-client<-
jvm.cfg[1] = ->-server<-
jvm.cfg[2] = ->-hotspot<-
jvm.cfg[3] = ->-classic<-
jvm.cfg[4] = ->-native<-
jvm.cfg[5] = ->-green<-
299 micro seconds to parse jvm.cfg
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/client/jvm.dll
2897 micro seconds to LoadJavaVM
JavaVM args:
version 0x00010002, ignoreUnrecognized is JNI_FALSE, nOptions is 2
option[ 0] = '-Djava.class.path=.'
option[ 1] = '-Dsun.java.command=test.ScanDirectory'
50001 micro seconds to InitializeJVM
Main-Class is 'test.ScanDirectory'
Apps' argc is 0
10208 micro seconds to load main class
----_JAVA_LAUNCHER_DEBUG----
usage: java test.ScanDirectory DIR [output file]
情況二
E:/work/java_research>java -XXaltjvm=D:/java/j2sdk1.4.2_04/jre/bin/client test.ScanDirectory
----_JAVA_LAUNCHER_DEBUG----
JRE path is D:/java/j2sdk1.4.2_04/jre
jvm.cfg[0] = ->-client<-
jvm.cfg[1] = ->-server<-
jvm.cfg[2] = ->-hotspot<-
jvm.cfg[3] = ->-classic<-
jvm.cfg[4] = ->-native<-
jvm.cfg[5] = ->-green<-
386 micro seconds to parse jvm.cfg
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/client/jvm.dll
2795 micro seconds to LoadJavaVM
JavaVM args:
version 0x00010002, ignoreUnrecognized is JNI_FALSE, nOptions is 2
option[ 0] = '-Djava.class.path=.'
option[ 1] = '-Dsun.java.command=test.ScanDirectory'
49978 micro seconds to InitializeJVM
Main-Class is 'test.ScanDirectory'
Apps' argc is 0
9598 micro seconds to load main class
----_JAVA_LAUNCHER_DEBUG----
usage: java test.ScanDirectory DIR [output file]
情況三
E:/work/java_research>java test.ScanDirectory
----_JAVA_LAUNCHER_DEBUG----
JRE path is D:/java/j2sdk1.4.2_04/jre
jvm.cfg[0] = ->-client<-
jvm.cfg[1] = ->-server<-
jvm.cfg[2] = ->-hotspot<-
jvm.cfg[3] = ->-classic<-
jvm.cfg[4] = ->-native<-
jvm.cfg[5] = ->-green<-
381 micro seconds to parse jvm.cfg
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/client/jvm.dll
3038 micro seconds to LoadJavaVM
JavaVM args:
version 0x00010002, ignoreUnrecognized is JNI_FALSE, nOptions is 2
option[ 0] = '-Djava.class.path=.'
option[ 1] = '-Dsun.java.command=test.ScanDirectory'
50080 micro seconds to InitializeJVM
Main-Class is 'test.ScanDirectory'
Apps' argc is 0
10215 micro seconds to load main class
----_JAVA_LAUNCHER_DEBUG----
usage: java test.ScanDirectory DIR [output file]
三個的JVM路徑都為:
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/client/jvm.dll
其他情況
E:/work/java_research>java -J-server test.ScanDirectory
----_JAVA_LAUNCHER_DEBUG----
JRE path is D:/java/j2sdk1.4.2_04/jre
jvm.cfg[0] = ->-client<-
jvm.cfg[1] = ->-server<-
jvm.cfg[2] = ->-hotspot<-
jvm.cfg[3] = ->-classic<-
jvm.cfg[4] = ->-native<-
jvm.cfg[5] = ->-green<-
377 micro seconds to parse jvm.cfg
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/server/jvm.dll
2985 micro seconds to LoadJavaVM
JavaVM args:
version 0x00010002, ignoreUnrecognized is JNI_FALSE, nOptions is 2
option[ 0] = '-Djava.class.path=.'
option[ 1] = '-Dsun.java.command=test.ScanDirectory'
62382 micro seconds to InitializeJVM
Main-Class is 'test.ScanDirectory'
Apps' argc is 0
12413 micro seconds to load main class
----_JAVA_LAUNCHER_DEBUG----
usage: java test.ScanDirectory DIR [output file]
E:/work/java_research>java -XXaltjvm=D:/java/j2sdk1.4.2_04/jre/bin/server test.ScanDirectory
----_JAVA_LAUNCHER_DEBUG----
JRE path is D:/java/j2sdk1.4.2_04/jre
jvm.cfg[0] = ->-client<-
jvm.cfg[1] = ->-server<-
jvm.cfg[2] = ->-hotspot<-
jvm.cfg[3] = ->-classic<-
jvm.cfg[4] = ->-native<-
jvm.cfg[5] = ->-green<-
376 micro seconds to parse jvm.cfg
JVM path is D:/java/j2sdk1.4.2_04/jre/bin/server/jvm.dll
2937 micro seconds to LoadJavaVM
JavaVM args:
version 0x00010002, ignoreUnrecognized is JNI_FALSE, nOptions is 2
option[ 0] = '-Djava.class.path=.'
option[ 1] = '-Dsun.java.command=test.ScanDirectory'
62725 micro seconds to InitializeJVM
Main-Class is 'test.ScanDirectory'
Apps' argc is 0
8942 micro seconds to load main class
----_JAVA_LAUNCHER_DEBUG----
usage: java test.ScanDirectory DIR [output file]
由上面可以看出,如果我們安裝了多個jdk或jre版本的話,使用“java -XXaltjvm=”
可以通過絕對路徑指定到其他版本的jvm.dll上去,至於能不能運行還有待測試。
我們下面回到java.c的main函數中看看上面找到的jvm.dll是如何裝載掛接執行的。
該操作大致分為三步:
a、裝載jvm.dll動態串連庫。
b、初始化jvm.dll並掛接到JNIEnv(JNI調用介面)執行個體。
c、調用JNIEnv執行個體裝載並處理class類。
實現:
a、裝載jvm.dll動態串連庫是由main函數調用java_md.c中LoadJavaVM函數實現的。
main函數首先構造了一個InvocationFunctions結構的局部變數,InvocationFunctions
結構有兩個函數指標:
typedef struct {
CreateJavaVM_t CreateJavaVM;
GetDefaultJavaVMInitArgs_t GetDefaultJavaVMInitArgs;
} InvocationFunctions;
函數LoadJavaVM中先調用windows API函數:LoadLibrary裝載jvm.dll動態串連庫,
之後將jvm.dll中的匯出函數JNI_CreateJavaVM和JNI_GetDefaultJavaVMInitArgs
掛接到InvocationFunctions變數的CreateJavaVM和GetDefaultJavaVMInitArgs函數
指標變數上。jvm.dll的裝載工作宣告完成。
b、初始化jvm.dll並掛接到JNIEnv(JNI調用介面)執行個體是通過java.c中函數:
InitializeJVM完成的。
main方法中首先定義了一個JNIEnv結構的指標,JNIEnv結構中定義了許多與裝載class
類檔案、尋找類方法、調用類方法有關的函數指標變數。InitializeJVM會調用上面
以掛接jvm.dll中JNI_CreateJavaVM的InvocationFunctions結構變數的CreateJavaVM方法,即調用jvm.dll中函數JNI_CreateJavaVM,該函數會將JNIEnv結構的執行個體返回到main中的JNIEnv結構的指標上。這樣main中的JNIEnv指標擷取了JNIEnv執行個體後,就可以開始對class檔案進行處理了。
c、調用JNIEnv執行個體裝載並處理class類。
a)如果是執行jar包。
如果執行的是一個jar包的話,main函數會調用java.c中的函數:GetMainClassName,該函數使用JNIEnv執行個體構造並調用java類:java.util.jar.JarFile中方法getManifest()並從返回的Manifest對象中取getAttributes("Main-Class")的值,即jar包中檔案:
META-INF/MANIFEST.MF指定的Main-Class的主類名作為啟動並執行主類。
之後main函數會調用java.c中LoadClass方法裝載該主類(使用JNIEnv執行個體的FindClass)。
b)如果是執行class方法。
main函數直接調用java.c中LoadClass方法裝載該類。
然後main函數調用JNIEnv執行個體的GetStaticMethodID方法尋找裝載的class主類中
“public static void main(String[] args)”方法,並判斷該方法是否為public方法,然後調用JNIEnv執行個體的CallStaticVoidMethod方法調用該java類的main方法。
總結
由上面的程式碼分析可以看出幾個問題。
a、為什麼JDK和JRE不一定通過安裝,直接拷到硬碟上,設定path環境變數就可以執行。因為java運行擷取jre路徑的首選方法正是直接通過擷取java.exe絕對路徑來判斷的,如果通過修改註冊表選項而不設定path環境變數也可以找到jre路徑所在。修改方法如下:
首先我們將java.exe拷到任意目錄下,我的拷到e:/temp下,在cmd中運行:
清空path環境變數
E:/temp>set path=
E:/temp>java
Error opening registry key 'Software/JavaSoft/Java Runtime Environment'
Error: could not find java.dll
Error: could not find Java 2 Runtime Environment.
匯入如下註冊表檔案(java.reg)
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE/SOFTWARE/JavaSoft]
[HKEY_LOCAL_MACHINE/SOFTWARE/JavaSoft/Java Runtime Environment]
"CurrentVersion"="1.4"
[HKEY_LOCAL_MACHINE/SOFTWARE/JavaSoft/Java Runtime Environment/1.4]
"JavaHome"="D://java//j2sdk1.4.2_04//jre"
再執行顯示執行正常,如下:
E:/temp>java
Usage: java [-options] class [args...]
(to execute a class)
or java [-options] -jar jarfile [args...]
(to execute a jar file)
where options include:
-client to select the "client" VM
-server to select the "server" VM
-hotspot is a synonym for the "client" VM [deprecated]
The default VM is client.
-cp <class search path of directories and zip/jar files>
-classpath <class search path of directories and zip/jar files>
A ; separated list of directories, JAR archives,
and ZIP archives to search for class files.
-D<name>=<value>
set a system property
-verbose[:class|gc|jni]
enable verbose output
-version print product version and exit
-showversion print product version and continue
-? -help print this help message
-X print help on non-standard options
-ea[:<packagename>...|:<classname>]
-enableassertions[:<packagename>...|:<classname>]
enable assertions
-da[:<packagename>...|:<classname>]
-disableassertions[:<packagename>...|:<classname>]
disable assertions
-esa | -enablesystemassertions
enable system assertions
-dsa | -disablesystemassertions
disable system assertions
b、java.exe是通過jvm.cfg檔案或直接指定jvm.dll路徑來裝載執行java程式的。
見上面例子。
c、不同實現版本的jvm.dll必然存在一個名為:JNI_CreateJavaVM的匯出函數,
java.exe正是通過調用該函數獲得JNIEnv調用介面來裝載執行class類的。這個
函數也是我們下一步研究java vm實作技巧的研究出發點。
JNI_CreateJavaVM函數位於:hotspot/src/share/vm/prims/jni.cpp檔案中。