本文章基於:http://www.cnblogs.com/QLinux/articles/2465329.html,稍作了修改。
大師級經典的著作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(Second Edition)中第1.5節的字元輸入/輸出,很迷惑getchar()和EOF的行為。因此,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,只有寫下來才是最好的方法。
一、對getchar的兩點總結:
1. getchar是以行為單位進行存取的。
當調用getchar函數讀取輸入時,只有當輸入字元為分行符號'/n'或檔案結束符EOF時,getchar才會停止執行,整個程式將會往下執行。並且,如果輸入行是以EOF結束的(EOF之前不是分行符號),則EOF會被“吃掉”(即不會被getchar讀取到)。譬如下面程式段:
while((c = getchar()) != EOF){
putchar(c);
}
執行程式
輸入:abc,然後斷行符號。則程式就會去執行puchar(c),然後輸出abc和一個斷行符號。然後可以繼續輸入,再次遇到分行符號的時候,程式又會把 那一行的輸入的字元輸出在終端上。
輸入:abc,然後執行ctrl+d,則程式區執行putchar(c),然後輸出abc。(此處ctrl+d和斷行符號具有一樣的功能)。
令人迷惑的是,getchar不是以字元為單位讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while迴圈(c = getchar()) != EOF的條件,那麼應該執行putchar(c)在終端輸出一個字元a。但是程式就偏偏不這樣執行,而是必需讀到一個分行符號或者檔案結束符EOF才進行一次輸出。
造成這種結果的一種解釋是,輸入終端驅動處於一次一行 的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字元進行的。但是終端驅動處於一次一行的模式,它的輸入只有到'/n'或 者EOF時才結束。在本例中,程式段調用了getchar函數,則控制權從程式段轉移到getchar函數,而getchar函數要依賴於作業系統的驅動 來讀取輸入,沒遇到分行符號或者EOF,驅動不會通知getchar函數,getchar函數處於“阻
塞”狀態。而遇到分行符號或者EOF後,getchar函數解除“阻塞”,讀取一個字元,控制權返回程 序段,執行putchar函數,迴圈執行。直到遇到EOF字元或者這行輸入全部處理完。
2. getchar()的傳回值一般情況下是非負 值,但也可能是負值,即返回EOF。這個EOF在函數庫裡一般定義為-1。正確的定義方法如下(K&R C中特別提到了這個問題):
int c;
c = getchar();
二、EOF的兩點總結(主要指普通終端中的EOF)
1. EOF作為檔案結束符時的情況:
EOF雖然是檔案結束符,但並不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現檔案結束的功能,只有在下列的條件下,才作為檔案結束符。
(1)遇到getcahr函數執行時,要輸入第一個字元時就直接輸入Ctrl+D;
(2)在前面輸入的字元為分行符號時, 接著輸入Ctrl+D;
(3)在前面有字元輸入且不為分行符號時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至於第一次的
Ctrl+D作為行結束符(如1.1所講)。
其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時, 直接輸入Ctrl+D才相當於檔案結束符。
2. EOF作為行結束符時的情況,這時候輸入Ctrl+D作為行結束的標誌能結束getchar()的“阻塞”,使getchar()逐個字元讀入,但是EOF會被“吃掉”,並不會被讀取。
以上面的程式碼片段為例, 如果執行時輸入abc,然後 Ctrl+D,程式輸出結果為:
abcabc
注意:第一組abc是你從終端輸入的,然後輸入Ctrl+D,getchar逐個字元讀取並逐個輸出列印出第二組abc,同時游標停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,就會起到了檔案結束符的作用,因為EOF是一行輸入的第一個字元。如果輸入abc之後,然後斷行符號,輸入分行符號的話,則終端顯示為:
abc'/n'
abc'/n'
//第三行
其中第一行為你是終端輸入的,第二行是終端輸出(含分行符號),游標停在了第三行處,等待新一次的終端輸入。從這裡也 可以看出Ctrl+D和分行符號分別作為行結束符時,輸出的不同結果。