目前市場上常用的開源Java Web容器有Tomcat、Resin和Jetty。其中Resin從V3.0後需要購買才能用於商業目的,而其他兩種則是純開源的。可以分別從他們的網站上下載最新的二進位包和原始碼。
作為Web容器,需要承受較高的訪問量,能夠同時響應不同使用者的請求,能夠在惡劣環境下保持較高的穩定性和健壯性。在HTTP伺服器領域,ApacheHTTPD的效率是最高的,也是最為穩定的,但它只能處理靜態頁面的請求,如果需要支援動態網頁面請求,則必須安裝相應的外掛程式,比如mod_perl可以處理Perl指令碼,mod_python可以處理Python指令碼。
上面介紹的三中Web容器,都是使用Java編寫的HTTP伺服器,當然他們都可以嵌到Apache中使用,也可以獨立使用。分析它們處理客戶請求的方法有助於瞭解Java多線程和線程池的實現方法,為設計強大的多線程伺服器打好基礎。
Tomcat是使用最廣的Java Web容器,功能強大,可擴充性強。最新版本的Tomcat(5.5.17)為了提高響應速度和效率,使用了Apache Portable Runtime(APR)作為最底層,使用了APR中包含Socket、緩衝池等多種技術,效能也提高了。APR也是Apache HTTPD的最底層。可想而知,同屬於ASF(Apache Software Foundation)中的成員,互補互用的情況還是很多的,雖然使用了不同的開發語言。
Tomcat 的線程池位於tomcat-util.jar檔案中,包含了兩種線程池方案。方案一:使用APR的Pool技術,使用了JNI;方案二:使用Java實現的ThreadPool。這裡介紹的是第二種。如果想瞭解APR的Pool技術,可以查看APR的原始碼。
ThreadPool預設建立了5個線程,儲存在一個200維的線程數組中,建立時就啟動了這些線程,當然在沒有請求時,它們都處理“等待”狀態(其實就是一個while迴圈,不停的等待notify)。如果有請求時,空閑線程會被喚醒執行使用者的請求。
具體的請求過程是:服務啟動時,建立一個一維線程數組(maxThread=200個),並建立空閑線程(minSpareThreads=5個)隨時等待使用者請求。當有使用者請求時,調用 threadpool.runIt(ThreadPoolRunnable)方法,將一個需要執行的執行個體傳給ThreadPool中。其中使用者需要執行的執行個體必須實現ThreadPoolRunnable介面。 ThreadPool首先尋找閒置線程,如果有則用它運行要執行ThreadPoolRunnable;如果沒有空閑線程並且沒有超過 maxThreads,就一次性建立minSpareThreads個空閑線程;如果已經超過了maxThreads了,就等待空閑線程了。總之,要找到閒置線程,以便用它執行執行個體。找到後,將該線程從線程數組中移走。接著喚醒已經找到的空閑線程,用它運行執行執行個體(ThreadPoolRunnable)。運行完ThreadPoolRunnable後,就將該線程重新放到線程數組中,作為空白閑線程供後續使用。
由此可以看出,Tomcat的線程池實現是比較簡單的,ThreadPool.java也只有840行代碼。用一個一維數組儲存閒置線程,每次以一個較小步伐(5個)建立空閑線程並放到線程池中。使用時從數組中移走閒置線程,用完後,再“歸還”給線程池。