什麼是IOCP
微軟在Winsock2中引入了IOCP這一概念 。IOCP全稱I/O Completion Port,中文譯為I/O完成連接埠。IOCP是一個非同步I/O的API,它可以高效地將I/O事件通知給應用程式。與使用select()或是其它非同步方法呼叫不同的是,一個通訊端[socket]與一個完成連接埠關聯了起來,然後就可繼續進行正常的Winsock操作了。然而,當一個事件發生的時候,此完成連接埠就將被作業系統加入一個隊列中。然後應用程式可以對核心層進行查詢以得到此完成連接埠。
這裡我要對上面的一些概念略作補充,在解釋[完成]兩字之前,我想先簡單的提一下同步和非同步這兩個概念,邏輯上來講做完一件事後再去做另一件事就是同步,而同時一起做兩件或兩件以上事的話就是非同步了。你也可以拿單線程和多線程來作比喻。但是我們一定要將同步和堵塞,非同步和非堵塞區分開來,所謂的堵塞函數諸如accept(…),當調用此函數後,此時線程將掛起,直到作業系統來通知它,”HEY兄弟,有人連進來了”,那個掛起的線程將繼續進行工作,也就符合”生產者-消費者”模型。堵塞和同步看上去有兩分相似,但卻是完全不同的概念。大家都知道I/O裝置是個相對慢速的裝置,不論印表機,數據機,甚至硬碟,與CPU相比都是奇慢無比的,坐下來等I/O的完成是一件不甚明智的事情,有時候資料的流動率非常驚人,把資料從你的檔案伺服器中以Ethernet速度搬走,其速度可能高達每秒一百萬位元組,如果你嘗試從檔案伺服器中讀取100KB,在使用者的眼光來看幾乎是瞬間完成,但是,要知道,你的線程執行這個命令,已經浪費了10個一百萬次CPU周期。所以說,我們一般使用另一個線程來進行I/O。重疊IO[overlapped I/O]是Win32的一項技術,你可以要求作業系統為你傳送資料,並且在傳送完畢時通知你。這也就是[完成]的含義。這項技術使你的程式在I/O進行過程中仍然能夠繼續處理事務。事實上,作業系統內部正是以線程來完成overlapped I/O。你可以獲得線程所有利益,而不需要付出什麼痛苦的代價。
完成連接埠中所謂的[連接埠]並不是我們在TCP/IP中所提到的連接埠,可以說是完全沒有關係。我到現在也沒想通一個I/O裝置[I/O Device]和連接埠[IOCP中的Port]有什麼關係。估計這個連接埠也迷惑了不少人。IOCP只不過是用來進行讀寫操作,和檔案I/O倒是有些類似。既然是一個讀寫裝置,我們所能要求它的只是在處理讀與寫上的高效。在文章的第三部分你會輕而易舉發現IOCP設計的真正用意。
IOCP和網路又有什麼關係?
int main()
{
WSAStartup(MAKEWORD(2, 2), &wsaData);
ListeningSocket = socket(AF_INET, SOCK_STREAM, 0);
bind(ListeningSocket, (SOCKADDR*)&ServerAddr, sizeof(ServerAddr));
listen(ListeningSocket, 5);
int nlistenAddrLen = sizeof(ClientAddr);
while(TRUE)
{
NewConnection = accept(ListeningSocket, (SOCKADDR*)&ClientAddr, &nlistenAddrLen);
HANDLE hThread = CreateThread(NULL, 0, ThreadFunc, (void*) NewConnection, 0, &dwTreadId);
CloseHandle(hThread);
}
return 0;
}
相信只要寫過網路的朋友,應該對這樣的結構在熟悉不過了。accept後線程被掛起,等待一個客戶發出請求,而後建立新線程來處理請求。當新線程處理客戶請求時,起初的線程迴圈回去等待另一個客戶請求。處理客戶請求的線程處理完畢後終結。
在上述的並行存取模型中,對每個客戶請求都建立了一個線程。其優點在於等待請求的線程只需做很少的工作。大多數時間中,該線程在休眠[因為recv處於堵塞狀態]。
但是當並行存取模型應用在伺服器端[基於Windows NT],Windows NT小組注意到這些應用程式的效能沒有預料的那麼高。特別的,處理很多同時的客戶請求意味著很多線程並發地運行在系統中。因為所有這些線程都是可啟動並執行[沒有被掛起和等待發生什麼事],Microsoft意識到NT核心花費了太多的時間來轉換運行線程的上下文[Context],線程就沒有得到很多CPU時間來做它們的工作。
大家都感覺到並行模型的瓶頸在於它為每一個客戶請求都建立了一個新線程。建立線程比起建立進程開銷要小,但也遠不是沒有開銷的。
我們不妨設想一下:如果事先開好N個線程,讓它們在那hold[堵塞],然後可以將所有使用者的請求都投遞到一個訊息佇列中去。然後那N個線程逐一從訊息佇列中去取出訊息並加以處理。就可以避免針對每一個使用者請求都開線程。不僅減少了線程的資源,也提高了線程的利用率。理論上很不錯,你想我等泛泛之輩都能想出來的問題,Microsoft又怎會沒有考慮到呢?!
這個問題的解決方案就是一個稱為I/O完成連接埠的核心對象,他首次在Windows NT3.5中被引入。
其實我們上面的構想應該就差不多是IOCP的設計機理。其實說穿了IOCP不就是一個訊息佇列嘛!你說這和[連接埠]這兩字有何聯絡。我的理解就是IOCP最多是應用程式和作業系統溝通的一個介面罷了。
至於IOCP的具體設計那我也很難說得上來,畢竟我沒看過實現的代碼,但你完全可以進行類比,只不過效能可能…,如果想深入理解IOCP, Jeffrey Ritchter的Advanced Windows 3rd其中第13章和第14張有很多寶貴的內容,你可以拿來窺視一下系統是如何完成這一切的。
實現方法
Microsoft為IOCP提供了相應的API函數,主要的就兩個,我們逐一的來看一下:
HANDLE CreateIoCompletionPort (
HANDLE FileHandle, // handle to file
HANDLE ExistingCompletionPort, // handle to I/O completion port
ULONG_PTR CompletionKey, // completion key
DWORD NumberOfConcurrentThreads // number of threads to execute concurrently
);
在討論各參數之前,首先要注意該函數實際用於兩個截然不同的目的:
1.用於建立一個完成連接埠對象
2.將一個控制代碼[HANDLE]和完成連接埠關聯到一起
在建立一個完成一個連接埠的時候,我們只需要填寫一下NumberOfConcurrentThreads這個參數就可以了。它告訴系統一個完成連接埠上同時允許啟動並執行線程最大數。在預設情況下,所開線程數和CPU數量相同,但經驗給我們一個公式:
線程數 = CPU數 * 2 + 2
要使完成連接埠有用,你必須把它同一個或多個裝置相關聯。這也是調用CreateIoCompletionPort完成的。你要向該函數傳遞一個已有的完成連接埠的控制代碼,我們既然要處理網路事件,那也就是將客戶的socket作為HANDLE傳進去。和一個完成鍵[對你有意義的一個32位值,也就是一個指標,作業系統並不關心你傳什麼]。每當你向連接埠關聯一個裝置時,系統向該完成連接埠的裝置列表中加入一條資訊紀錄。
另一個API就是
BOOL GetQueuedCompletionStatus(
HANDLE CompletionPort, // handle to completion port
LPDWORD lpNumberOfBytes, // bytes transferred
PULONG_PTR lpCompletionKey, // file completion key
LPOVERLAPPED *lpOverlapped, // buffer
DWORD dwMilliseconds // optional timeout value
);
第一個參數指出了線程要監視哪一個完成連接埠。很多服務應用程式只是使用一個I/O完成連接埠,所有的I/O請求完成以後的通知都將發給該連接埠。簡單的說,GetQueuedCompletionStatus使調用線程掛起,直到指定的連接埠的I/O完成隊列中出現了一項或直到逾時。同I/O完成連接埠相關聯的第3個資料結構是使線程得到完成I/O項中的資訊:傳輸的位元組數,完成鍵和OVERLAPPED結構的地址。該資訊是通過傳遞給GetQueuedCompletionSatatus的lpdwNumberOfBytesTransferred,lpdwCompletionKey和lpOverlapped參數返回給線程的。
根據到目前為止已經講到的東西,首先來構建一個frame。下面為您說明了如何使用完成連接埠來開發一個echo伺服器。大致如下:
1.初始化Winsock
2.建立一個完成連接埠
3.根據伺服器線程數建立一定量的線程數
4.準備好一個socket進行bind然後listen
5.進入迴圈accept等待客戶請求
6.建立一個資料結構容納socket和其他相關資訊
7.將連進來的socket同完成連接埠相關聯
8.投遞一個準備接受的請求
以後就不斷的重複5至8的過程
關於.Net中如何?IOCP的文章:
http://msdn.microsoft.com/zh-cn/magazine/cc163356.aspx
http://msdn.microsoft.com/zh-cn/library/system.net.sockets.socketasynceventargs.aspx