IO的方式通常分為幾種,同步阻塞的BIO、同步非阻塞的NIO、非同步非阻塞的AIO
一.BIO
在JDK1.4出來之前,我們建立網路連接的時候採用BIO模式,需要先在服務端啟動一個ServerSocket,然後在用戶端啟動Socket來對服務端進行通訊,預設情況下服務端需要對每個請求建立一堆線程等待請求,而用戶端發送請求後,先諮詢服務端是否有線程相應,如果沒有則會一直等待或者遭到拒絕請求,如果有的話,用戶端會線程會等待請求結束後才繼續執行。
二.NIO
NIO本身是基於事件驅動思想來完成的,其主要想解決的是BIO的大並發問題: 在使用同步I/O的網路應用中,如果要同時處理多個用戶端請求,或是在用戶端要同時和多個伺服器進行通訊,就必須使用多線程來處理。也就是說,將每一個用戶端請求分配給一個線程來單獨處理。這樣做雖然可以達到我們的要求,但同時又會帶來另外一個問題。由於每建立一個線程,就要為這個線程分配一定的記憶體空間(也叫工作儲存空間),而且作業系統本身也對線程的總數有一定的限制。如果用戶端的請求過多,服務端程式可能會因為不堪重負而拒絕用戶端的請求,甚至伺服器可能會因此而癱瘓。
NIO基於Reactor,當socket有流可讀或可寫入socket時,作業系統會相應的通知引用程式進行處理,應用再將流讀取到緩衝區或寫入作業系統。 也就是說,這個時候,已經不是一個串連就要對應一個處理線程了,而是有效請求,對應一個線程,當串連沒有資料時,是沒有背景工作執行緒來處理的
BIO與NIO一個比較重要的不同,是我們使用BIO的時候往往會引入多線程,每個串連一個單獨的線程;而NIO則是使用單線程或者只使用少量的多線程,每個串連共用一個線程。
NIO的最重要的地方是當一個串連建立後,不需要對應一個線程,這個串連會被註冊到多工器上面,所以所有的串連只需要一個線程就可以搞定,當這個線程中的多工器進行輪詢的時候,發現串連上有請求的話,才開啟一個線程進行處理,也就是一個請求一個線程模式。
在NIO的處理方式中,當一個請求來的話,開啟線程進行處理,可能會等待後端應用的資源(JDBC串連等),其實這個線程就被阻塞了,當並發上來的話,還是會有BIO一樣的問題。
HTTP/1.1出現後,有了Http長串連,這樣除了逾時和指明特定關閉的http header外,這個連結是一直開啟的狀態的,這樣在NIO處理中可以進一步的進化,在後端資源中可以實現資源集區或者隊列,當請求來的話,開啟的線程把請求和請求資料傳送給後端資源集區或者隊列裡面就返回,並且在全域的地方保持住這個現場(哪個串連的哪個請求等),這樣前面的線程還是可以去接受其他的請求,而後端的應用的處理只需要執行隊列裡面的就可以了,這樣請求處理和後端應用是非同步.當後端處理完,到全域地方得到現場,產生響應,這個就實現了非同步處理。
三.AIO
與NIO不同,當進行讀寫操作時,只須直接調用API的read或write方法即可。這兩種方法均為非同步,對於讀操作而言,當有流可讀取時,作業系統會將可讀的流傳入read方法的緩衝區,並通知應用程式;對於寫操作而言,當作業系統將write方法傳遞的流寫入完畢時,作業系統主動通知應用程式。 即可以理解為,read/write方法都是非同步,完成後會主動調用回呼函數。 在JDK1.7中,這部分內容被稱作NIO.2,主要在java.nio.channels包下增加了下面四個非同步通道: AsynchronousSocketChannel AsynchronousServerSocketChannel AsynchronousFileChannel AsynchronousDatagramChannel
其中的read/write方法,會返回一個帶回呼函數的對象,當執行完讀取/寫入操作後,直接調用回呼函數。 BIO是一個串連一個線程。 NIO是一個請求一個線程。 AIO是一個有效請求一個線程
先來個例子理解一下概念,以銀行取款為例: 同步 : 自己親自出馬持銀行卡到銀行取錢(使用同步IO時,Java自己處理IO讀寫); 非同步 : 委託一小弟拿銀行卡到銀行取錢,然後給你(使用非同步IO時,Java將IO讀寫委託給OS處理,需要將資料緩衝區地址和大小傳給OS(銀行卡和密碼),OS需要支援非同步IO操作API); 阻塞 : ATM排隊取款,你只能等待(使用阻塞IO時,Java調用會一直阻塞到讀寫完成才返回); 非阻塞 : 櫃檯取款,取個號,然後坐在椅子上做其它事,等號廣播會通知你辦理,沒到號你就不能去,你可以不斷問大堂經理排到了沒有,大堂經理如果說還沒到你就不能去(使用非阻塞IO時,如果不能讀寫Java調用會馬上返回,當IO事件分發器會通知可讀寫時再繼續進行讀寫,不斷迴圈直到讀寫完成)
Java對BIO、NIO、AIO的支援: Java BIO : 同步並阻塞,伺服器實現模式為一個串連一個線程,即用戶端有串連請求時伺服器端就需要啟動一個線程進行處理,如果這個串連不做任何事情會造成不必要的線程開銷,當然可以通過線程池機制改善。 Java NIO : 同步非阻塞,伺服器實現模式為一個請求一個線程,即用戶端發送的串連請求都會註冊到多工器上,多工器輪詢到串連有I/O請求時才啟動一個線程進行處理。 Java AIO(NIO.2) : 非同步非阻塞,伺服器實現模式為一個有效請求一個線程,用戶端的I/O請求都是由OS先完成了再通知伺服器應用去啟動線程進行處理
BIO、NIO、AIO適用情境分析: BIO方式適用於串連數目比較小且固定的架構,這種方式對伺服器資源要求比較高,並發局限於應用中,JDK1.4以前的唯一選擇,但程式直觀簡單易理解。 NIO方式適用於串連數目多且串連比較短(輕操作)的架構,比如聊天伺服器,並發局限於應用中,編程比較複雜,JDK1.4開始支援。 AIO方式使用於串連數目多且串連比較長(重操作)的架構,比如相簿伺服器,充分調用OS參與並行作業,編程比較複雜,JDK7開始支援
另外,I/O屬於底層操作,需要作業系統支援,並發也需要作業系統的支援,所以效能方面不同作業系統差異會比較明顯。
在高效能的I/O設計中,有兩個比較著名的模式Reactor和Proactor模式,其中Reactor模式用於同步I/O,而Proactor運用於非同步I/O操作。
在比較這兩個模式之前,我們首先的搞明白幾個概念,什麼是阻塞和非阻塞,什麼是同步和非同步,同步和非同步是針對應用程式和核心的互動而言的,同步指的是使用者進程觸發IO操作並等待或者輪詢的去查看IO操作是否就緒,而非同步是指使用者進程觸發IO操作以後便開始做自己的事情,而當IO操作已經完成的時候會得到IO完成的通知。而阻塞和非阻塞是針對於進程在訪問資料的時候,根據IO操作的就緒狀態來採取的不同方式,說白了是一種讀取或者寫入操作函數的實現方式,阻塞方式下讀取或者寫入函數將一直等待,而非阻塞方式下,讀取或者寫入函數會立即返回一個狀態值。
一般來說I/O模型可以分為:同步阻塞,同步非阻塞,非同步阻塞,非同步非阻塞IO
同步阻塞IO:在此種方式下,使用者進程在發起一個IO操作以後,必須等待IO操作的完成,只有當真正完成了IO操作以後,使用者進程才能運行。JAVA傳統的IO模型屬於此種方式。
同步非阻塞IO:在此種方式下,使用者進程發起一個IO操作以後邊可返回做其它事情,但是使用者進程需要時不時的詢問IO操作是否就緒,這就要求使用者進程不停的去詢問,從而引入不必要的CPU資源浪費。其中目前JAVA的NIO就屬於同步非阻塞IO。
非同步阻塞IO:此種方式下是指應用發起一個IO操作以後,不等待核心IO操作的完成,等核心完成IO操作以後會通知應用程式,這其實就是同步和非同步最關鍵的區別,同步必須等待或者主動的去詢問IO是否完成,那麼為什麼說是阻塞的呢。因為此時是通過select系統調用來完成的,而select函數本身的實現方式是阻塞的,而採用select函數有個好處就是它可以同時監聽多個檔案控制代碼,從而提高系統的並發性。
非同步非阻塞IO:在此種模式下,使用者進程只需要發起一個IO操作然後立即返回,等IO操作真正的完成以後,應用程式會得到IO操作完成的通知,此時使用者進程只需要對資料進行處理就好了,不需要進行實際的IO讀寫操作,因為真正的IO讀取或者寫入操作已經由核心完成了。目前Java中還沒有支援此種IO模型。