【轉載】Java NIO(非阻塞IO) API介紹__io

來源:互聯網
上載者:User

轉載自:http://blog.csdn.net/daijialin/article/details/231384
在JDK 1.4以前,Java的IO操作集中在java.io這個包中,是基於流的阻塞(blocking)API。對於大多數應用來說,這樣的API使用很方便,然而,一些對效能要求較高的應用,尤其是服務端應用,往往需要一個更為有效方式來處理IO。從JDK 1.4起,NIO API作為一個基於緩衝區,並能提供非阻塞(non-blocking)IO操作的API被引入。本文對其進行深入的介紹。  NIO API主要集中在java.nio和它的subpackages中:

java.nio

          定義了Buffer及其資料類型相關的子類。其中被java.nio.channels中的類用來進行IO操作的ByteBuffer的作用非常重要。

java.nio.channels

          定義了一系列處理IO的Channel介面以及這些介面在檔案系統和網路通訊上的實現。通過Selector這個類,還提供了進行非阻塞IO操作的辦法。這個包可以說是NIO API的核心。

java.nio.channels.spi

          定義了可用來實現channel和selector API的抽象類別。

java.nio.charset

         定義了處理字元編碼和解碼的類。

java.nio.charset.spi

        定義了可用來實現charset API的抽象類別。

java.nio.channels.spi和java.nio.charset.spi這兩個包主要被用來對現有NIO API進行擴充,在實際的使用中,我們一般只和另外的3個包打交道。下面將對這3個包一一介紹。  Package java.nio

這個包主要定義了Buffer及其子類。Buffer定義了一個線性存放primitive type資料的容器介面。對於除boolean以外的其他primitive type,都有一個相應的Buffer子類,ByteBuffer是其中最重要的一個子類。

 下面這張UML類圖描述了java.nio中的類的關係:



 

Buffer

定義了一個可以線性存放primitive type資料的容器介面。Buffer主要包含了與類型(byte, char…)無關的功能。值得注意的是Buffer及其子類都不是安全執行緒的。

每個Buffer都有以下的屬性:

capacity

          這個Buffer最多能放多少資料。capacity一般在buffer被建立的時候指定。

limit

          在Buffer上進行的讀寫操作都不能越過這個下標。當寫資料到buffer中時,limit一般和capacity相等,當讀資料時,limit代表buffer中有效資料的長度。

position

          讀/寫操作的當前下標。當使用buffer的相對位置進行讀/寫操作時,讀/寫會從這個下標進行,並在操作完成後,buffer會更新下標的值。

mark

          一個臨時存放的位置下標。調用mark()會將mark設為當前的position的值,以後調用reset()會將position屬性設定為mark的值。mark的值總是小於等於position的值,如果將position的值設的比mark小,當前的mark值會被拋棄掉。

這些屬性總是滿足以下條件:

0 <= mark <= position <= limit <= capacity

 limit和position的值除了通過limit()和position()函數來設定,也可以通過下面這些函數來改變:

Buffer clear()

          把position設為0,把limit設為capacity,一般在把資料寫入Buffer前調用。

Buffer flip()

         把limit設為當前position,把position設為0,一般在從Buffer讀出資料前調用。

Buffer rewind()

         把position設為0,limit不變,一般在把資料重寫入Buffer前調用。

Buffer對象有可能是唯讀,這時,任何對該對象的寫操作都會觸發一個ReadOnlyBufferException。isReadOnly()方法可以用來判斷一個Buffer是否唯讀。


ByteBuffer

在Buffer的子類中,ByteBuffer是一個地位較為特殊的類,因為在java.io.channels中定義的各種channel的IO操作基本上都是圍繞ByteBuffer展開的。

ByteBuffer定義了4個static方法來做建立工作:

ByteBuffer allocate(int capacity)

          建立一個指定capacity的ByteBuffer。

ByteBuffer allocateDirect(int capacity)

          建立一個direct的ByteBuffer,這樣的ByteBuffer在參與IO操作時效能會更好(很有可能是在底層的實現使用了DMA技術),相應的,建立和回收direct的ByteBuffer的代價也會高一些。isDirect()方法可以檢查一個buffer是否是direct的。

ByteBuffer wrap(byte [] array)

ByteBuffer wrap(byte [] array, int offset, int length)

         把一個byte數組或byte數組的一部分封裝成ByteBuffer。

ByteBuffer定義了一系列get和put操作來從中讀寫byte資料,如下面幾個:

byte get()

ByteBuffer get(byte [] dst)

byte get(int index)

ByteBuffer put(byte b)

ByteBuffer put(byte [] src)

ByteBuffer put(int index, byte b)

這些操作可分為絕對位置和相對定為兩種,相對定位的讀寫操作依靠position來定位Buffer中的位置,並在操作完成後會更新position的值。在其它類型的buffer中,也定義了相同的函數來讀寫資料,唯一不同的就是一些參數和傳回值的類型。

 除了讀寫byte類型資料的函數,ByteBuffer的一個特別之處是它還定義了讀寫其它primitive資料的方法,如:

 int getInt()

       從ByteBuffer中讀出一個int值。

ByteBuffer putInt(int value)

       寫入一個int值到ByteBuffer中。

讀寫其它類型的資料牽涉到位元組序問題,ByteBuffer會按其位元組序(大位元組序或小位元組序)寫入或讀出一個其它類型的資料(int,long…)。位元組序可以用order方法來取得和設定:

ByteOrder order()

       返回ByteBuffer的位元組序。

ByteBuffer order(ByteOrder bo)

       設定ByteBuffer的位元組序。

ByteBuffer另一個特別的地方是可以在它的基礎上得到其它類型的buffer。如:

CharBuffer asCharBuffer()

       為當前的ByteBuffer建立一個CharBuffer的視圖。在該視圖buffer中的讀寫操作會按照ByteBuffer的位元組序作用到ByteBuffer中的資料上。

用這類方法建立出來的buffer會從ByteBuffer的position位置開始到limit位置結束,可以看作是這段資料的視圖。視圖buffer的readOnly屬性和direct屬性與ByteBuffer的一致,而且也只有通過這種方法,才可以得到其他資料類型的direct buffer。

 

ByteOrder

用來表示ByteBuffer位元組序的類,可將其看成java中的enum類型。主要定義了下面幾個static方法和屬性:

ByteOrder BIG_ENDIAN

       代表大位元組序的ByteOrder。

ByteOrder LITTLE_ENDIAN

       代表小位元組序的ByteOrder。

ByteOrder nativeOrder()

       返回當前硬體平台的位元組序。


MappedByteBuffer

ByteBuffer的子類,是檔案內容在記憶體中的映射。這個類的執行個體需要通過FileChannel的map()方法來建立。

接下來看看一個使用ByteBuffer的例子,這個例子從標準輸入不停地讀入字元,當讀滿一行後,將收集的字元寫到標準輸出:

public static void main(String [] args)       throws IOException    {       // 建立一個capacity為256的ByteBuffer       ByteBuffer buf = ByteBuffer.allocate(256);       while (true) {           // 從標準輸入資料流讀入一個字元           int c = System.in.read();           // 當讀到輸入資料流結束時,退出迴圈           if (c == -1)              break;           // 把讀入的字元寫入ByteBuffer中           buf.put((byte) c);           // 當讀完一行時,輸出收集的字元           if (c == '/n') {              // 調用flip()使limit變為當前的position的值,position變為0,              // 為接下來從ByteBuffer讀取做準備              buf.flip();              // 構建一個byte數組              byte [] content = new byte[buf.limit()];              // 從ByteBuffer中讀取資料到byte數組中              buf.get(content);               // 把byte數組的內容寫到標準輸出              System.out.print(new String(content));              // 調用clear()使position變為0,limit變為capacity的值,              // 為接下來寫入資料到ByteBuffer中做準備              buf.clear();           }       }    }


Package java.nio.channels

這個包定義了Channel的概念,Channel表現了一個可以進行IO操作的通道(比如,通過FileChannel,我們可以對檔案進行讀寫操作)。java.nio.channels包含了檔案系統和網路通訊相關的channel類。這個包通過Selector和SelectableChannel這兩個類,還定義了一個進行非阻塞(non-blocking)IO操作的API,這對需要高效能IO的應用非常重要。

下面這張UML類圖描述了java.nio.channels中interface的關係:



 

Channel

Channel表現了一個可以進行IO操作的通道,該interface定義了以下方法:

boolean isOpen()

       該Channel是否是開啟的。

void close()

       關閉這個Channel,相關的資源會被釋放。


ReadableByteChannel

定義了一個可從中讀取byte資料的channel interface。

int read(ByteBuffer dst)

      從channel中讀取byte資料並寫到ByteBuffer中。返回讀取的byte數。

WritableByteChannel

      定義了一個可向其寫byte資料的channel interface。

int write(ByteBuffer src)

      從ByteBuffer中讀取byte資料並寫到channel中。返回寫出的byte數。


ByteChannel

     ByteChannel並沒有定義新的方法,它的作用只是把ReadableByteChannel和WritableByteChannel合并在一起。

ScatteringByteChannel

    繼承了ReadableByteChannel並提供了同時往幾個ByteBuffer中寫資料的能力。

GatheringByteChannel

    繼承了WritableByteChannel並提供了同時從幾個ByteBuffer中讀資料的能力。

InterruptibleChannel

用來表現一個可以被非同步關閉的Channel。這表現在兩方面:

1.當一個InterruptibleChannel的close()方法被調用時,其它block在這個InterruptibleChannel的IO操作上的線程會接收到一個AsynchronousCloseException。

2.當一個線程block在InterruptibleChannel的IO操作上時,另一個線程調用該線程的interrupt()方法會導致channel被關閉,該線程收到一個ClosedByInterruptException,同時線程的interrupt狀態會被設定。


接下來的這張UML類圖描述了java.nio.channels中類的關係:



  非阻塞IO

非阻塞IO的支援可以算是NIO API中最重要的功能,非阻塞IO允許應用程式同時監控多個channel以提高效能,這一功能是通過Selector,SelectableChannel和SelectionKey這3個類來實現的。

SelectableChannel代表了可以支援非阻塞IO操作的channel,可以將其註冊在Selector上,這種註冊的關係由SelectionKey這個類來表現(見UML圖)。Selector這個類通過select()函數,給應用程式提供了一個可以同時監控多個IO channel的方法:

應用程式通過調用select()函數,讓Selector監控註冊在其上的多個SelectableChannel,當有channel的IO操作可以進行時,select()方法就會返回以讓應用程式檢查channel的狀態,並作相應的處理。


下面是JDK 1.4中非阻塞IO的一個例子,這段code使用了非阻塞IO實現了一個time server:

private static void acceptConnections(int port) throws Exception {       // 開啟一個Selector       Selector acceptSelector =           SelectorProvider.provider().openSelector();       // 建立一個ServerSocketChannel,這是一個SelectableChannel的子類       ServerSocketChannel ssc = ServerSocketChannel.open();       // 將其設為non-blocking狀態,這樣才能進行非阻塞IO操作       ssc.configureBlocking(false);       // 給ServerSocketChannel對應的socket綁定IP和連接埠       InetAddress lh = InetAddress.getLocalHost();       InetSocketAddress isa = new InetSocketAddress(lh, port);       ssc.socket().bind(isa);       // 將ServerSocketChannel註冊到Selector上,返回對應的SelectionKey       SelectionKey acceptKey =           ssc.register(acceptSelector, SelectionKey.OP_ACCEPT);       int keysAdded = 0;       // 用select()函數來監控註冊在Selector上的SelectableChannel       // 傳回值代表了有多少channel可以進行IO操作 (ready for IO)       while ((keysAdded = acceptSelector.select()) > 0) {           // selectedKeys()返回一個SelectionKey的集合,           // 其中每個SelectionKey代表了一個可以進行IO操作的channel。           // 一個ServerSocketChannel可以進行IO操作意味著有新的TCP串連連入了           Set readyKeys = acceptSelector.selectedKeys();           Iterator i = readyKeys.iterator();           while (i.hasNext()) {              SelectionKey sk = (SelectionKey) i.next();              // 需要將處理過的key從selectedKeys這個集合中刪除              i.remove();              // 從SelectionKey得到對應的channel              ServerSocketChannel nextReady =                  (ServerSocketChannel) sk.channel();              // 接受新的TCP串連              Socket s = nextReady.accept().socket();              // 把當前的時間寫到這個新的TCP串連中              PrintWriter out =                  new PrintWriter(s.getOutputStream(), true);              Date now = new Date();              out.println(now);              // 關閉串連              out.close();           }       }    }
這是個純粹用於示範的例子,因為只有一個ServerSocketChannel需要監控,所以其實並不真的需要使用到非阻塞IO。不過正因為它的簡單,可以很容易地看清楚非阻塞IO是如何工作的。


SelectableChannel

這個抽象類別是所有支援非阻塞IO操作的channel(如DatagramChannel、SocketChannel)的父類。SelectableChannel可以註冊到一個或多個Selector上以進行非阻塞IO操作。

SelectableChannel可以是blocking和non-blocking模式(所有channel建立的時候都是blocking模式),只有non-blocking的SelectableChannel才可以參與非阻塞IO操作。

SelectableChannel configureBlocking(boolean block)

       設定blocking模式。

boolean isBlocking()

       返回blocking模式。

通過register()方法,SelectableChannel可以註冊到Selector上。

int validOps()

       返回一個bit mask,表示這個channel上支援的IO操作。當前在SelectionKey中,用靜態常量定義了4種IO操作的bit值:OP_ACCEPT,OP_CONNECT,OP_READ和OP_WRITE

SelectionKey register(Selector sel, int ops)

       將當前channel註冊到一個Selector上並返回對應的SelectionKey。在這以後,通過調用Selector的select()函數就可以監控這個channel。ops這個參數是一個bit mask,代表了需要監控的IO操作。

SelectionKey register(Selector sel, int ops, Object att)

       這個函數和上一個的意義一樣,多出來的att參數會作為attachment被存放在返回的SelectionKey中,這在需要存放一些session state的時候非常有用。

boolean isRegistered()

       該channel是否登入在一個或多個Selector上。

SelectableChannel還提供了得到對應SelectionKey的方法:

SelectionKey keyFor(Selector sel)

       返回該channe在Selector上的註冊關係所對應的SelectionKey。若無註冊關係,返回null。


Selector

Selector可以同時監控多個SelectableChannel的IO狀況,是非阻塞IO的核心。

Selector open()

       Selector的一個靜態方法,用於建立執行個體。

在一個Selector中,有3個SelectionKey的集合:

1. key set代表了所有註冊在這個Selector上的channel,這個集合可以通過keys()方法拿到。

2. Selected-key set代表了所有通過select()方法監測到可以進行IO操作的channel,這個集合可以通過selectedKeys()拿到。

3. Cancelled-key set代表了已經cancel了註冊關係的channel,在下一個select()操作中,這些channel對應的SelectionKey會從key set和cancelled-key set中移走。這個集合無法直接存取。

以下是select()相關方法的說明:

int select()

       監控所有註冊的channel,當其中有註冊的IO操作可以進行時,該函數返回,並將對應的SelectionKey加入selected-key set。

int select(long timeout)

       可以設定逾時的select()操作。

int selectNow()

       進行一個立即返回的select()操作。

Selector wakeup()

       使一個還未返回的select()操作立刻返回。

 

SelectionKey

代表了Selector和SelectableChannel的註冊關係。

 Selector定義了4個靜態常量來表示4種IO操作,這些常量可以進行位操作組合成一個bit mask。

 int OP_ACCEPT

      有新的網路連接可以accept,ServerSocketChannel支援這一非阻塞IO。

int OP_CONNECT

      代表串連已經建立(或出錯),SocketChannel支援這一非阻塞IO。

int OP_READ

int OP_WRITE

      代表了讀、寫操作。

 以下是其主要方法:

 Object attachment()

       返回SelectionKey的attachment,attachment可以在註冊channel的時候指定。

Object attach(Object ob)

       設定SelectionKey的attachment。

SelectableChannel channel()

       返回該SelectionKey對應的channel。

Selector selector()

       返回該SelectionKey對應的Selector。

void cancel()

       cancel這個SelectionKey所對應的註冊關係。

int interestOps()

       返回代表需要Selector監控的IO操作的bit mask。

SelectionKey interestOps(int ops)

       設定interestOps。

int readyOps()

       返回一個bit mask,代表在相應channel上可以進行的IO操作。

 

ServerSocketChannel

支援非阻塞操作,對應於java.net.ServerSocket這個類,提供了TCP協議IO介面,支援OP_ACCEPT操作。

ServerSocket socket()

       返回對應的ServerSocket對象。

SocketChannel accept()

       接受一個串連,返回代表這個串連的SocketChannel對象。

 

SocketChannel

支援非阻塞操作,對應於java.net.Socket這個類,提供了TCP協議IO介面,支援OP_CONNECT,OP_READ和OP_WRITE操作。這個類還實現了ByteChannel,ScatteringByteChannel和GatheringByteChannel介面。

DatagramChannel和這個類比較相似,其對應於java.net.DatagramSocket,提供了UDP協議IO介面。

Socket socket()

       返回對應的Socket對象。

boolean connect(SocketAddress remote)

boolean finishConnect()

connect()進行一個串連操作。如果當前SocketChannel是blocking模式,這個函數會等到串連操作完成或錯誤發生才返回。如果當前SocketChannel是non-blocking模式,函數在串連能立刻被建立時返回true,否則函數返回false,應用程式需要在以後用finishConnect()方法來完成串連操作。


Pipe

包含了一個讀和一個寫的channel(Pipe.SourceChannel和Pipe.SinkChannel),這對channel可以用於進程中的通訊。


FileChannel

用於對檔案的讀、寫、映射、鎖定等操作。和映射操作相關的類有FileChannel.MapMode,和鎖定操作相關的類有FileLock。值得注意的是FileChannel並不支援非阻塞操作。

 

Channels

這個類提供了一系列static方法來支援stream類和channel類之間的互操作。這些方法可以將channel類封裝為stream類,比如,將ReadableByteChannel封裝為InputStream或Reader;也可以將stream類封裝為channel類,比如,將OutputStream封裝為WritableByteChannel。


Package java.nio.charset

這個包定義了Charset及相應的encoder和decoder。下面這張UML類圖描述了這個包中類的關係,可以將其中Charset,CharsetDecoder和CharsetEncoder理解成一個Abstract Factory模式的實現:



 

Charset

代表了一個字元集,同時提供了factory method來構建相應的CharsetDecoder和CharsetEncoder。

Charset提供了以下static的方法:

SortedMap availableCharsets()

       返回當前系統支援的所有Charset對象,用charset的名字作為set的key。

boolean isSupported(String charsetName)

       判斷該名字對應的字元集是否被當前系統支援。

Charset forName(String charsetName)

       返回該名字對應的Charset對象。

Charset中比較重要的方法有:

String name()

       返回該字元集的規範名。

Set aliases()

       返回該字元集的所有別名。

CharsetDecoder newDecoder()

       建立一個對應於這個Charset的decoder。

CharsetEncoder newEncoder()

       建立一個對應於這個Charset的encoder。

 

CharsetDecoder

將按某種字元集編碼的位元組流解碼為unicode字元資料的引擎。

CharsetDecoder的輸入是ByteBuffer,輸出是CharBuffer。進行decode操作時一般按如下步驟進行:

1. 調用CharsetDecoder的reset()方法。(第一次使用時可不調用)

2. 調用decode()方法0到n次,將endOfInput參數設為false,告訴decoder有可能還有新的資料送入。

3. 調用decode()方法最後一次,將endOfInput參數設為true,告訴decoder所有資料都已經送入。

4. 調用decoder的flush()方法。讓decoder有機會把一些內部狀態寫到輸出的CharBuffer中。

CharsetDecoder reset()

       重設decoder,並清除decoder中的一些內部狀態。

CoderResult decode(ByteBuffer in, CharBuffer out, boolean endOfInput)

       從ByteBuffer類型的輸入中decode儘可能多的位元組,並將結果寫到CharBuffer類型的輸出中。根據decode的結果,可能返回3種CoderResult:CoderResult.UNDERFLOW表示已經沒有輸入可以decode;CoderResult.OVERFLOW表示輸出已滿;其它的CoderResult表示decode過程中有錯誤發生。根據返回的結果,應用程式可以採取相應的措施,比如,增加輸入,清除輸出等等,然後再次調用decode()方法。

CoderResult flush(CharBuffer out)

       有些decoder會在decode的過程中保留一些內部狀態,調用這個方法讓這些decoder有機會將這些內部狀態寫到輸出的CharBuffer中。調用成功返回CoderResult.UNDERFLOW。如果輸出的空間不夠,該函數返回CoderResult.OVERFLOW,這時應用程式應該擴大輸出CharBuffer的空間,然後再次調用該方法。

CharBuffer decode(ByteBuffer in)

      一個便捷的方法把ByteBuffer中的內容decode到一個新建立的CharBuffer中。在這個方法中包括了前面提到的4個步驟,所以不能和前3個函數一起使用。


decode過程中的錯誤有兩種:malformed-input CoderResult表示輸入中資料有誤;unmappable-character CoderResult表示輸入中有資料無法被解碼成unicode的字元。如何處理decode過程中的錯誤取決於decoder的設定。對於這兩種錯誤,decoder可以通過CodingErrorAction設定成:

1. 忽略錯誤

2. 報告錯誤。(這會導致錯誤發生時,decode()方法返回一個表示該錯誤的CoderResult。)

3. 替換錯誤,用decoder中的替換字串替換掉有錯誤的部分。

CodingErrorAction malformedInputAction()

       返回malformed-input的出錯處理。

CharsetDecoder onMalformedInput(CodingErrorAction newAction)

       設定malformed-input的出錯處理。

CodingErrorAction unmappableCharacterAction()

       返回unmappable-character的出錯處理。

CharsetDecoder onUnmappableCharacter(CodingErrorAction newAction)

       設定unmappable-character的出錯處理。

String replacement()

       返回decoder的替換字串。

CharsetDecoder replaceWith(String newReplacement)

       設定decoder的替換字串。

 

CharsetEncoder

將unicode字元資料編碼為特定字元集的位元組流的引擎。其介面和CharsetDecoder相類似。

 

CoderResult

描述encode/decode操作結果的類。

CodeResult包含兩個static成員:

CoderResult OVERFLOW

       表示輸出已滿

CoderResult UNDERFLOW

       表示輸入已無資料可用。

其主要的成員函數有:

boolean isError()

boolean isMalformed()

boolean isUnmappable()

boolean isOverflow()

boolean isUnderflow()

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.