linux非阻塞式socket編程之select()用法

來源:互聯網
上載者:User

 Select在Socket編程中還是比較重要的,可是對於初學Socket的人來說都不太愛用Select寫程式,他們只是習慣寫諸如 connect、accept、recv或recvfrom這樣的阻塞程式(所謂阻塞方式block,顧名思義,就是進程或是線程執行到這些函數時必須等待某個事件的發生,如果事件沒有發生,進程或線程就被阻塞,函數不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non- block,就是進程或線程執行此函數時不必非要等待事件的發生,一旦執行肯定返回,以傳回值的不同來反映函數的執行情況,如果事件發生則與阻塞方式相同,若事件沒有發生則返回一個代碼來告知事件未發生,而進程或線程繼續執行,所以效率較高)方式工作的程式,它能夠監視我們需要監視的檔案描述符的變化情況讀寫或是異常。下面詳細介紹一下!

Select的函數格式(我所說的是Unix系統下的伯克利socket編程,和windows下的有區別,一會兒說明):

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

先說明兩個結構體:

第一,struct fd_set可以理解為一個集合,這個集合中存放的是檔案描述符(file descriptor),即檔案控制代碼,這可以是我們所說的普通意義的檔案,當然Unix下任何裝置、管道、FIFO等都是檔案形式,全部包括在內,所以毫無疑問一個socket就是一個檔案,socket控制代碼就是一個檔案描述符。fd_set集合可以通過一些宏由人為來操作,比如清空集合 FD_ZERO(fd_set *),將一個給定的檔案描述符加入集合之中FD_SET(int ,fd_set *),將一個給定的檔案描述符從集合中刪除FD_CLR(int
,fd_set*),檢查集合中指定的檔案描述符是否可以讀寫FD_ISSET(int ,fd_set* )。一會兒舉例說明。

第二,struct timeval是一個大家常用的結構,用來代表時間值,有兩個成員,一個是秒數,另一個是毫秒數。

具體解釋select的參數:

int maxfdp是一個整數值,是指集合中所有檔案描述符的範圍,即所有檔案描述符的最大值加1,不能錯!在Windows中這個參數的值無所謂,可以設定不正確。

fd_set *readfds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的讀變化的,即我們關心是否可以從這些檔案中讀取資料了,如果這個集合中有一個檔案可讀,select就會返回一個大於0的值,表示有檔案可讀,如果沒有可讀的檔案,則根據timeout參數再判斷是否逾時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的讀變化。

fd_set *writefds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的寫變化的,即我們關心是否可以向這些檔案中寫入資料了,如果這個集合中有一個檔案可寫,select就會返回一個大於0的值,表示有檔案可寫,如果沒有可寫的檔案,則根據timeout參數再判斷是否逾時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的寫變化。

fd_set *errorfds同上面兩個參數的意圖,用來監視檔案錯誤異常。

struct timeval* timeout是select的逾時時間,這個參數至關重要,它可以使select處於三種狀態,第一,若將NULL以形參傳入,即不傳入時間結構,就是將select置於阻塞狀態,一定等到監視檔案描述符集合中某個檔案描述符發生變化為止;第二,若將時間值設為0秒0毫秒,就變成一個純粹的非阻塞函數,不管檔案描述符是否有變化,都立刻返回繼續執行,檔案無變化返回0,有變化返回一個正值;第三,timeout的值大於0,這就是等待的逾時時間,即 select在timeout時間內阻塞,逾時時間之內有事件到來就返回了,否則在逾時後不管怎樣一定返回,傳回值同上述。

傳回值:

負值:select錯誤 正值:某些檔案可讀寫或出錯 0:等待逾時,沒有可讀寫或錯誤的檔案

在有了select後可以寫出像樣的網路程式來!舉個簡單的例子,就是從網路上接受資料寫入一個檔案中。

例子:

main()

{

int sock;

FILE *fp;

struct fd_set fds;

struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0

char buffer[256]={0}; //256位元組的接收緩衝區

/* 假定已經建立UDP串連,具體過程不寫,簡單,當然TCP也同理,主機ip和port都已經給定,要寫的檔案已經開啟

sock=socket(...);

bind(...);

fp=fopen(...); */

while(1)

{

FD_ZERO(&fds); //每次迴圈都要清空集合,否則不能檢測描述符變化

FD_SET(sock,&fds); //添加描述符

FD_SET(fp,&fds); //同上

maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1

switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用

{

case -1: exit(-1);break; //select錯誤,退出程式

case 0:break; //再次輪詢

default:

if(FD_ISSET(sock,&fds)) //測試sock是否可讀,即是否網路上有資料

{

recvfrom(sock,buffer,256,.....);//接受網路資料

if(FD_ISSET(fp,&fds)) //測試檔案是否可寫

fwrite(fp,buffer...);//寫入檔案

buffer清空;

}// end if break;

}// end switch

}//end while

}//end main

----------------------------------------------------------
Linux select()詳解

Linux select()詳解       select系統調用是用來讓我們的程式監視多個檔案控制代碼(file descriptor)的狀態變化的。程式會停在select這裡等待,直到被監視的檔案控制代碼有某一個或多個發生了狀態改變。

    檔案在控制代碼在Linux裡很多,如果你man某個函數,在函數傳回值部分說到成功後有一個檔案控制代碼被建立的都是的,如man socket可以看到“On success, a file descriptor for the new socket is returned.”而man 2 open可以看到“open() and creat() return the new file descriptor”,其實檔案控制代碼就是一個整數,看socket函數的聲明就明白了:
    int socket(int domain, int type, int protocol);
當然,我們最熟悉的控制代碼是0、1、2三個,0是標準輸入,1是標準輸出,2是標準錯誤輸出。0、1、2是整數表示的,對應的FILE *結構的表示就是stdin、stdout、stderr,0就是stdin,1就是stdout,2就是stderr。
比如下面這兩段代碼都是從標準輸入讀入9個位元組字元:

#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
        char buf[10] = "";
        read(0, buf, 9); /* 從標準輸入 0 讀入字元 */
        fprintf(stdout, "%s\n", buf); /* 向標準輸出 stdout 寫字元 */
        return 0;
}
/* **上面和下面的代碼都可以用來從標準輸入讀使用者輸入的9個字元** */
#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
        char buf[10] = "";
        fread(buf, 9, 1, stdin); /* 從標準輸入 stdin 讀入字元 */
        write(1, buf, strlen(buf));
        return 0;
}
   繼續上面說的select,就是用來監視某個或某些控制代碼的狀態變化的。select函數原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
函數的最後一個參數timeout顯然是一個逾時時間值,其類型是struct timeval *,即一個struct timeval結構的變數的指標,所以我們在程式裡要申明一個struct timeval tv;然後把變數tv的地址&tv傳遞給select函數。struct timeval結構如下:

struct timeval {
             long    tv_sec;         /* seconds */
             long    tv_usec;        /* microseconds */
         };
   第2、3、4三個參數是一樣的類型: fd_set *,即我們在程式裡要申明幾個fd_set類型的變數,比如rdfds, wtfds, exfds,然後把這個變數的地址&rdfds, &wtfds, &exfds 傳遞給select函數。這三個參數都是一個控制代碼的集合,第一個rdfds是用來儲存這樣的控制代碼的:當控制代碼的狀態變成可讀的時系統就會告訴select函數返回,同理第二個wtfds是指有控制代碼狀態變成可寫的時系統就會告訴select函數返回,同理第三個參數exfds是特殊情況,即控制代碼上有特殊情況發生時系統會告訴select函數返回。特殊情況比如對方通過一個socket控制代碼發來了緊急資料。如果我們程式裡只想檢測某個socket是否有資料可讀,我們可以這樣:

fd_set rdfds; /* 先申明一個 fd_set 集合來儲存我們要檢測的 socket控制代碼 */
struct timeval tv; /* 申明一個時間變數來儲存時間 */
int ret; /* 儲存傳回值 */
FD_ZERO(&rdfds); /* 用select函數之前先把集合清零 */
FD_SET(socket, &rdfds); /* 把要檢測的控制代碼socket加入到集合裡 */
tv.tv_sec = 1;
tv.tv_usec = 500; /* 設定select等待的最大時間為1秒加500毫秒 */
ret = select(socket + 1, &rdfds, NULL, NULL, &tv); /* 檢測我們上面設定到集合rdfds裡的控制代碼是否有可讀資訊 */
if(ret < 0) perror("select");/* 這說明select函數出錯 */
else if(ret == 0) printf("逾時\n"); /* 說明在我們設定的時間值1秒加500毫秒的時間內,socket的狀態沒有發生變化 */
else { /* 說明等待時間還未到1秒加500毫秒,socket的狀態發生了變化 */
    printf("ret=%d\n", ret); /* ret這個傳回值記錄了發生狀態變化的控制代碼的數目,由於我們只監視了socket這一個控制代碼,所以這裡一定ret=1,如果同時有多個控制代碼發生變化返回的就是控制代碼的總和了 */
    /* 這裡我們就應該從socket這個控制代碼裡讀取資料了,因為select函數已經告訴我們這個控制代碼裡有資料可讀 */
    if(FD_ISSET(socket, &rdfds)) { /* 先判斷一下socket這外被監視的控制代碼是否真的變成可讀的了 */
        /* 讀取socket控制代碼裡的資料 */
        recv(...);
    }
}
   注意select函數的第一個參數,是所有加入集合的控制代碼值的最大那個值還要加1。比如我們建立了3個控制代碼:
/************關於本文檔********************************************
*filename: Linux網路編程一步一步學-select詳解
*purpose: 詳細說明select的用法
*wrote by: zhoulifa(zhoulifa@163.com) 周立發(http://zhoulifa.bokee.com)
Linux愛好者 Linux知識傳播者 SOHO族 開發人員 最擅長C語言
*date time:2007-02-03 19:40
*Note: 任何人可以任意複製代碼並運用這些文檔,當然包括你的商業用途
* 但請遵循GPL
*Thanks to:Google
*Hope:希望越來越多的人貢獻自己的力量,為科學技術發展出力
* 科技站在巨人的肩膀上進步更快!感謝有開源前輩的貢獻!
*********************************************************************/

int sa, sb, sc;
sa = socket(...); /* 分別建立3個控制代碼並串連到伺服器上 */
connect(sa,...);
sb = socket(...);
connect(sb,...);
sc = socket(...);
connect(sc,...);

FD_SET(sa, &rdfds);/* 分別把3個控制代碼加入讀監視集合裡去 */
FD_SET(sb, &rdfds);
FD_SET(sc, &rdfds);
   在使用select函數之前,一定要找到3個控制代碼中的最大值是哪個,我們一般定義一個變數來儲存最大值,取得最大socket值如下:

int maxfd = 0;
if(sa > maxfd) maxfd = sa;
if(sb > maxfd) maxfd = sb;
if(sc > maxfd) maxfd = sc;
   然後調用select函數:
ret = select(maxfd + 1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
   同樣的道理,如果我們要檢測使用者是否按了鍵盤進行輸入,我們就應該把標準輸入0這個控制代碼放到select裡來檢測,如下:

FD_ZERO(&rdfds);
FD_SET(0, &rdfds);
tv.tv_sec = 1;
tv.tv_usec = 0;
ret = select(1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
if(ret < 0) perror("select");/* 出錯 */
else if(ret == 0) printf("逾時\n"); /* 在我們設定的時間tv內,使用者沒有按鍵盤 */
else { /* 使用者有按鍵盤,要讀取使用者的輸入 */
    scanf("%s", buf);
}----------------------------------------------------------
Linux select學習筆記

select系統調用是用來讓我們的程式監視多個檔案描述符(file descrīptor)的狀態變化的。程式會停在select這裡等待,直到被監視的檔案描述符有某一個或多個發生了狀態改變。select()的機制中提供一fd_set的資料結構,實際上是一long類型的數組, 每一個數組元素都能與一開啟的檔案描述符(不管是Socket描述符,還是其他 檔案或具名管道或裝置描述符)建立聯絡,建立聯絡的工作由程式員完成, 當調用select()時,由核心根據IO狀態修改fd_set的內容,由此來通知執 行了select()的進程哪一Socket或檔案可讀,

select函數原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

函數的最後一個參數timeout顯然是一個逾時時間值,其類型是struct timeval *,即一個struct timeval結構的變數的指標,所以我們在程式裡要申明一個struct timeval tv;然後把變數tv的地址&tv傳遞給select函數。struct timeval結構如下:

struct timeval {
long   tv_sec;     /* seconds */
long   tv_usec;    /* microseconds */
};

第2、3、4三個參數的類型是一樣的: fd_set *,即我們在程式裡要申明幾個fd_set類型的變數,比如定義了rfds, wfds, efds。

另外關於fd_set類型的變數,還有一組標準的宏定義來處理此類變數:

FD_ZERO(fd_set *fdset):清空fdset與所有檔案描述符的聯絡。

FD_SET(int fd, fd_set *fdset):建立檔案描述符fd與fdset的聯絡。

FD_CLR(int fd, fd_set *fdset):清除檔案描述符fd與fdset的聯絡。

FD_ISSET(int fd, fd_set *fdset):檢查fd_set聯絡的檔案描述符fd是否可讀寫,>0表示可讀寫。

(關於fd_set及相關宏的定義見/usr/include/sys/types.h)定義的這三個參數都是描述符的集合,第一個rfds是用來儲存這樣的描述符的:當描述符的狀態變成可讀的時系統就會告訴select函數返回,第二個wfds是指有描述符狀態變成可寫的時系統就會告訴select函數返回,第三個參數efds是特殊情況,即描述符上有特殊情況發生時系統會告訴select函數返回。下面以一個輸入為例來說明:

int fd1, fd2;         /* 在定義兩個描述符*/

fd1 = socket(...);    /* 建立socket串連*/

fd2 = open(“/dev/tyS0”,O_RDWR); /* 開啟一個串口*/

FD_ZERO(&rfds);       /* 用select函數之前先把集合清零 */

FD_SET(fd1, &rfds);   /* 分別把2個描述符加入讀監視集合裡去 */

FD_SET(fd2, &rfds);

int maxfd = 0;

maxfd = (fd1>fd2)?(fd1+1):(fd2+1);           /* 注意是最大值還要加1 */

ret = select(maxfd, &rfds, NULL, NULL, &tv); /*然後調用select函數*/

這樣就可以使用一個開關語句(switch語句)來判斷到底是哪一個輸入源在輸入資料。具體判斷如下:

switch(ret){

case -1:perror("select");/* 這說明select函數出錯 */

case 0:printf("逾時\n"); /* 說明在設定的時間內,socket的狀態沒有發生變化 */

default:

if(FD_ISSET(fd1, &rfds)) 處理函數1();/*socket有資料來*/

if(FD_ISSET(fd2, &rfds)) 處理函數2();/*ttyS0有資料來*/

}

 

以下來自網路搜尋:

Linux下select調用的過程:

1.使用者層應用程式調用select(),底層調用poll())

2.核心層調用sys_select() ------> do_select()

最終調用檔案描述符fd對應的struct file類型變數的struct file_operations *f_op的poll函數。

poll指向的函數返回當前可否讀寫的資訊。

1)如果當前可讀寫,返回讀寫資訊。

2)如果當前不可讀寫,則阻塞進程,並等待驅動程式喚醒,重新調用poll函數,或逾時返回。

3.驅動需要實現poll函數。

當驅動發現有資料可以讀寫時,通知核心層,核心層重新調用poll指向的函數查詢資訊。

poll_wait(filp,&wait_q,wait) // 此處將當前進程加入到等待隊列中,但並不阻塞

在中斷中使用wake_up_interruptible(&wait_q)喚醒等待隊列

----------------------------------------------------------
Socket編程中select()的妙用
 
用過 WinSock API 網友們知道:WinSock 編程中有一很方便的地方便是其
息驅動機制,不管是底層 API 的 WSAAsyncSelect() 還是 MFC 的非同步Socket類:
CAsyncSocket,都提供了諸如 FD_ACCEPT、FD_READ、FD_CLOSE 之類的訊息
供編程人員捕捉並處理。FD_ACCEPT 通知進程有客戶方Socket請求串連,
FD_READ通知進程本地Socket有東東可讀,FD_CLOSE通知進程對方Socket已
關閉。那麼,BSD Socket 是不是真的相形見拙呢?
 
非也! 'cause cpu love unix so.
 
BSD UNIX中有一系統調用芳名select()完全可以提供類似的訊息驅動機制。
cpu鄭重宣布:WinSock的WSAAsyncSeclet()不過是此select()的fork版!
 
bill也是fork出來的嘛,xixi.
 
select()的機制中提供一fd_set的資料結構,實際上是一long類型的數組,
每一個數組元素都能與一開啟的檔案控制代碼(不管是Socket控制代碼,還是其他
檔案或具名管道或裝置控制代碼)建立聯絡,建立聯絡的工作由程式員完成,
當調用select()時,由核心根據IO狀態修改fd_set的內容,由此來通知執
行了select()的進程哪一Socket或檔案可讀,下面具體解釋:
 
#include  <sys/types.h>
#include  <sys/times.h>
#include  <sys/select.h>
 
int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;
 
ndfs:select監視的檔案控制代碼數,視進程中開啟的檔案數而定,一般設為呢要監視各檔案
      中的最大檔案號加一。
readfds:select監視的可讀檔案控制代碼集合。
writefds: select監視的可寫檔案控制代碼集合。
exceptfds:select監視的異常檔案控制代碼集合。
timeout:本次select()的逾時結束時間。(見/usr/sys/select.h,
        可精確至百萬分之一秒!)
 
當readfds或writefds中映象的檔案可讀或可寫或逾時,本次select()
就結束返回。程式員利用一組系統提供的宏在select()結束時便可判
斷哪一檔案可讀或可寫。對Socket編程特別有用的就是readfds。
幾隻相關的宏解釋如下:
 
FD_ZERO(fd_set *fdset):清空fdset與所有檔案控制代碼的聯絡。
FD_SET(int fd, fd_set *fdset):建立檔案控制代碼fd與fdset的聯絡。
FD_CLR(int fd, fd_set *fdset):清除檔案控制代碼fd與fdset的聯絡。
FD_ISSET(int fd, fdset *fdset):檢查fdset聯絡的檔案控制代碼fd是否
                                可讀寫,>0表示可讀寫。
(關於fd_set及相關宏的定義見/usr/include/sys/types.h)
 
這樣,你的socket只需在有東東讀的時候才讀入,大致如下:
 
...
int     sockfd;
fd_set  fdR;
struct  timeval timeout = ..;
...
for(;;) {
        FD_ZERO(&fdR);
        FD_SET(sockfd, &fdR);
        switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
                case -1:
                        error handled by u;
                case 0:
                        timeout hanled by u;
                default:
                        if (FD_ISSET(sockfd)) {
                                now u read or recv something;
                                /* if sockfd is father and 
                                server socket, u can now
                                accept() */
                        }
        }
}
 
所以一個FD_ISSET(sockfd)就相當通知了sockfd可讀。
至於struct timeval在此的功能,請man select。不同的timeval設定
使使select()表現出逾時結束、無逾時阻塞和輪詢三種特性。由於
timeval可精確至百萬分之一秒,所以Windows的SetTimer()根本不算
什麼。你可以用select()做一個超級時鐘。
 
FD_ACCEPT的實現?依然如上,因為客戶方socket請求串連時,會發送
串連請求報文,此時select()當然會結束,FD_ISSET(sockfd)當然大
於零,因為有報文可讀嘛!至於這方面的應用,主要在於服務方的父
Socket,你若不喜歡主動accept(),可改為如上機制來accept()。
 
至於FD_CLOSE的實現及處理,頗費了一堆cpu處理時間,未完待續。
 
--
討論關於利用select()檢測對方Socket關閉的問題:
 
仍然是本地Socket有東東可讀,因為對方Socket關閉時,會發一個關閉串連
通知報文,會馬上被select()檢測到的。關於TCP的串連(三向交握)和關
閉(二次握手)機制,敬請參考有關TCP/IP的書籍。
 
不知是什麼原因,UNIX好象沒有提供通知進程關於Socket或Pipe對方關閉的
訊號,也可能是cpu所知有限。總之,當對方關閉,一執行recv()或read(),
馬上回返回-1,此時全域變數errno的值是115,相應的sys_errlist[errno]
為"Connect refused"(請參考/usr/include/sys/errno.h)。所以,在上
篇的for(;;)...select()程式塊中,當有東西可讀時,一定要檢查recv()或
read()的傳回值,返回-1時要作出關斷本地Socket的處理,否則select()會
一直認為有東西讀,其結果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢
查recv()返回結果,且將收到的東東(實際沒收到)寫至標準輸出...
在有名管道的編程中也有類似問題出現。具體處理詳見拙作:發布一個有用
的Socket客戶方原碼。
 
至於主動寫Socket時對方突然關閉的處理則可以簡單地捕捉訊號SIGPIPE並作
出相應關斷本地Socket等等的處理。SIGPIPE的解釋是:寫入無讀者方的管道。
在此不作贅述,請詳man signal。
 
以上是cpu在作tcp/ip資料轉送實驗積累的經驗,若有錯漏,請狂炮擊之。
 
唉,昨天在hacker區被一幫孫子轟得差點兒沒短路。ren cpu(奔騰的心) z80
 
補充關於select在非同步(非阻塞)connect中的應用,剛開始搞socket編程的時候
我一直都用阻塞式的connect,非阻塞connect的問題是由於當時搞proxy scan
而提出的呵呵
通過在網上與網友們的交流及尋找相關FAQ,總算知道了怎麼解決這一問題.同樣
用select可以很好地解決這一問題.大致過程是這樣的:
 
1.將開啟的socket設為非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完
成(有的系統用FNEDLAY也可).
 
2.發connect調用,這時返回-1,但是errno被設為EINPROGRESS,意即connect仍舊
在進行還沒有完成.
 
3.將開啟的socket設進被監視的可寫(注意不是可讀)檔案集合用select進行監視,
如果可寫,用
        getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
來得到error的值,如果為零,則connect成功.
 
在許多unix版本的proxyscan程式你都可以看到類似的過程,另外在solaris精華
區->編程技巧中有一個通用的帶逾時參數的connect模組. 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.