printf可能是許多程式員在開始學習C語言時接觸到的第二個函數(我猜第一個是main),說起來,自然是老朋友了,可是,你對這個老朋友瞭解多嗎?你對它的那個孿生兄弟sprintf瞭解多嗎?在將各種類型的資料構造成字串時,sprintf的強大功能很少會讓你失望。
由於sprintf跟printf在用法上幾乎一樣,只是列印的目的地不同而已,前者列印到字串中,後者則直接在命令列上輸出。這也導致sprintf比printf有用得多。所以本文著重介紹sprintf,有時也穿插著用用pritnf。
sprintf是個變參函數,定義如下:
int sprintf( char *buffer, const char *format [, argument] ... );
除了前兩個參數類型固定外,後面可以接任意多個參數。而它的精華,顯然就在第二個參數:格式化字串上。
printf和sprintf都使用格式化字串來指定串的格式,在格式串內部使用一些以“%”開頭的格式說明符(format specifications)來佔據一個位置,在後邊的變參列表中提供相應的變數,最終函數就會用相應位置的變數來替代那個說明符,產生一個調用者想要的字串。
1. 格式化數字字串
sprintf最常見的應用之一莫過於把整數列印到字串中,所以,spritnf在大多數場合可以替代itoa。如:
//把整數123列印成一個字串儲存在s中。
sprintf(s, "%d", 123); //產生"123"
可以指定寬度,不足的左邊補空格:
sprintf(s, "%8d%8d", 123, 4567); //產生:" 123 4567"
當然也可以靠左對齊:
sprintf(s, "%-8d%8d", 123, 4567); //產生:"123 4567"
也可以按照16進位列印:
sprintf(s, "%8x", 4567); //小寫16進位,寬度佔8個位置,靠右對齊
sprintf(s, "%-8X", 4568); //大寫16進位,寬度佔8個位置,靠左對齊
這樣,一個整數的16進位字串就很容易得到,但我們在列印16進位內容時,通常想要一種左邊補0的等寬格式,那該怎麼做呢?很簡單,在表示寬度的數字前面加個0就可以了。
sprintf(s, "%08X", 4567); //產生:"000011D7"
上面以”%d”進行的10進位列印同樣也可以使用這種左邊補0的方式。
這裡要注意一個符號擴充的問題:比如,假如我們想列印短整數(short)-1的記憶體16進位表示形式,在Win32平台上,一個short型佔2個位元組,所以我們自然希望用4個16進位數字來列印它:
short si = -1;
sprintf(s, "%04X", si);
產生“FFFFFFFF”,怎麼回事?因為spritnf是個變參函數,除了前面兩個參數之外,後面的參數都不是型別安全的,函數更沒有辦法僅僅通過一個“%X”就能得知當初函數調用前參數壓棧時被壓進來的到底是個4位元組的整數還是個2位元組的短整數,所以採取了統一4位元組的處理方式,導致參數壓棧時做了符號擴充,擴充成了32位的整數-1,列印時4個位置不夠了,就把32位整數-1的8位16進位都列印出來了。如果你想看si的本來面目,那麼就應該讓編譯器做0擴充而不是符號擴充(擴充時二進位左邊補0而不是補符號位):
sprintf(s, "%04X", (unsigned short)si);
就可以了。或者:
unsigned short si = -1;
sprintf(s, "%04X", si);
sprintf和printf還可以按8進位列印整數字串,使用”%o”。注意8進位和16進位都不會列印出負數,都是無符號的,實際上也就是變數的內部編碼的直接的16進位或8進位表示。
2. 控制浮點數列印格式
浮點數的列印和格式控制是sprintf的又一大常用功能,浮點數使用格式符”%f”控制,預設保留小數點後6位元字,比如:
sprintf(s, "%f", 3.1415926); //產生"3.141593"
但有時我們希望自己控制列印的寬度和小數位元,這時就應該使用:”%m.nf”格式,其中m表示列印的寬度,n表示小數點後的位元。比如:
sprintf(s, "%10.3f", 3.1415626); //產生:" 3.142"
sprintf(s, "%-10.3f", 3.1415626); //產生:"3.142 "
sprintf(s, "%.3f", 3.1415626); //不指定總寬度,產生:"3.142"
注意一個問題,你猜
int i = 100;
sprintf(s, "%.2f", i);
會打出什麼東東來?“100.00”?對嗎?自己試試就知道了,同時也試試下面這個:
sprintf(s, "%.2f", (double)i);
第一個打出來的肯定不是正確結果,原因跟前面提到的一樣,參數壓棧時調用者並不知道跟i相對應的格式控制符是個”%f”。而函數執行時函數本身則並不知道當年被壓入棧裡的是個整數,於是可憐的儲存整數i的那4個位元組就被不由分說地強行作為浮點數格式來解釋了,整個亂套了。
不過,如果有人有興趣使用手工編碼一個浮點數,那麼倒可以使用這種方法來檢驗一下你手工編排的結果是否正確。J
字元/Ascii碼對照
我們知道,在C/C++語言中,char也是一種普通的scalable類型,除了字長之外,它與short,int,long這些類型沒有本質區別,只不過被大家習慣用來表示字元和字串而已。(或許當年該把這個類型叫做“byte”,然後現在就可以根據實際情況,使用byte或short來把char通過typedef定義出來,這樣更合適些)
於是,使用”%d”或者”%x”列印一個字元,便能得出它的10進位或16進位的ASCII碼;反過來,使用”%c”列印一個整數,便可以看到它所對應的ASCII字元。以下程式段把所有可見字元的ASCII碼對照表列印到螢幕上(這裡採用printf,注意”#”與”%X”合用時自動為16進位數增加”0X”首碼):
for(int i = 32; i < 127; i++) {
printf("[ %c ]: %3d 0x%#04X\n", i, i, i);
}
3. 連接字串
sprintf的格式控制串中既然可以插入各種東西,並最終把它們“連成一串”,自然也就能夠連接字串,從而在許多場合可以替代strcat,但sprintf能夠一次串連多個字串(自然也可以同時在它們中間插入別的內容,總之非常靈活)。比如:
char* who = "I";
char* whom = "CSDN";
sprintf(s, "%s love %s.", who, whom); //產生:"I love CSDN. "
strcat只能連接字串(一段以’\0’結尾的字元數組或叫做字元緩衝,null-terminated-string),但有時我們有兩段字元緩衝區,他們並不是以’\0’結尾。比如許多從第三方庫函數中返回的字元數組,從硬體或者網路傳輸中讀進來的字元流,它們未必每一段字元序列後面都有個相應的’\0’來結尾。如果直接連接,不管是sprintf還是strcat肯定會導致非法記憶體操作,而strncat也至少要求第一個參數是個null-terminated-string,那該怎麼辦呢?我們自然會想起前面介紹列印整數和浮點數時可以指定寬度,字串也一樣的。比如:
char a1[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G'};
char a2[] = {'H', 'I', 'J', 'K', 'L', 'M', 'N'};
如果:
sprintf(s, "%s%s", a1, a2); //Don't do that!
十有八九要出問題了。是否可以改成:
sprintf(s, "%7s%7s", a1, a2);
也沒好到哪兒去,正確的應該是:
sprintf(s, "%.7s%.7s", a1, a2);//產生:"ABCDEFGHIJKLMN"
這可以類比列印浮點數的”%m.nf”,在”%m.ns”中,m表示佔用寬度(字串長度不足時補空格,超出了則按照實際寬度列印),n才表示從相應的字串中最多取用的字元數。通常在列印字串時m沒什麼大用,還是點號後面的n用的多。自然,也可以前後都只取部分字元:
sprintf(s, "%.6s%.5s", a1, a2);//產生:"ABCDEFHIJKL"
在許多時候,我們或許還希望這些格式控制符中用以指定長度資訊的數字是動態,而不是靜態指定的,因為許多時候,程式要到運行時才會清楚到底需要取字元數組中的幾個字元,這種動態寬度/精度設定功能在sprintf的實現中也被考慮到了,sprintf採用”*”來佔用一個本來需要一個指定寬度或精度的常數數位位置,同樣,而實際的寬度或精度就可以和其它被列印的變數一樣被提供出來,於是,上面的例子可以變成:
sprintf(s, "%.*s%.*s", 7, a1, 7, a2);
或者:
sprintf(s, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2);
實際上,前面介紹的列印字元、整數、浮點數等都可以動態指定那些常量值,比如:
sprintf(s, "%-*d", 4, 'A'); //產生"65 "
sprintf(s, "%#0*X", 8, 128); //產生"0X000080","#"產生0X
sprintf(s, "%*.*f", 10, 2, 3.1415926); //產生" 3.14"
4. 列印地址資訊
有時偵錯工具時,我們可能想查看某些變數或者成員的地址,由於地址或者指標也不過是個32位的數,你完全可以使用列印不帶正負號的整數的”%u”把他們列印出來:
sprintf(s, "%u", &i);
不過通常人們還是喜歡使用16進位而不是10進位來顯示一個地址:
sprintf(s, "%08X", &i);
然而,這些都是間接的方法,對於地址列印,sprintf 提供了專門的”%p”:
sprintf(s, "%p", &i);
我覺得它實際上就相當於:
sprintf(s, "%0*x", 2 * sizeof(void *), &i);
5. 利用sprintf的傳回值
較少有人注意printf/sprintf函數的傳回值,但有時它卻是有用的,spritnf返回了本次函數調用最終列印到字元緩衝區中的字元數目。也就是說每當一次sprinf調用結束以後,你無須再調用一次strlen便已經知道了結果字串的長度。如:
int len = sprintf(s, "%d", i);
對於正整數來說,len便等於整數i的10進位位元。
下面的是個完整的例子,產生10個[0, 100)之間的隨機數,並將他們列印到一個字元數組s中,以逗號分隔開。
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
int main() {
srand(time(0));
char s[64];
int offset = 0;
for(int i = 0; i < 10; i++) {
offset += sprintf(s + offset, "%d,", rand() % 100);
}
s[offset - 1] = '\n';//將最後一個逗號換成分行符號。
printf(s);
return 0;
}
設想當你從資料庫中取出一條記錄,然後希望把他們的各個欄位按照某種規則串連成一個字串時,就可以使用這種方法,從理論上講,他應該比不斷的strcat效率高,因為strcat每次調用都需要先找到最後的那個’\0’的位置,而在上面給出的例子中,我們每次都利用sprintf傳回值把這個位置直接記下來了。
6. 使用sprintf的常見問題
sprintf是個變參函數,使用時經常出問題,而且只要出問題通常就是能導致程式崩潰的記憶體訪問錯誤,但好在由sprintf誤用導致的問題雖然嚴重,卻很容易找出,無非就是那麼幾種情況,通常用眼睛再把出錯的代碼多看幾眼就看出來了。
? 緩衝區溢位
第一個參數的長度太短了,沒的說,給個大點的地方吧。當然也可能是後面的參數的問題,建議變參對應一定要細心,而列印字串時,盡量使用”%.ns”的形式指定最大字元數。
? 忘記了第一個參數
低級得不能再低級問題,用printf用得太慣了。//偶就常犯。:。(
? 變參對應出問題
通常是忘記了提供對應某個格式符的變參,導致以後的參數統統錯位,檢查檢查吧。尤其是對應”*”的那些參數,都提供了嗎?不要把一個整數對應一個”%s”,編譯器會覺得你欺她太甚了(編譯器是obj和exe的媽媽,應該是個女的,:P)。
7. strftime
sprintf還有個不錯的表妹:strftime,專門用于格式化時間字串的,用法跟她表哥很像,也是一大堆格式控制符,只是畢竟小姑娘家心細,她還要調用者指定緩衝區的最大長度,可能是為了在出現問題時可以推卸責任吧。這裡舉個例子:
time_t t = time(0);
//產生"YYYY-MM-DD hh:mm:ss"格式的字串。
char s[32];
strftime(s, sizeof(s), "%Y-%m-%d %H:%M:%S", localtime(&t));
sprintf在MFC中也能找到他的知音:CString::Format,strftime在MFC中自然也有她的同道:CTime::Format,這一對由於從物件導向哪裡得到了贊助,用以寫出的代碼更覺優雅。
8. 後記
本文介紹的所有這些功能,在MSDN中都可以很容易地查到,筆者只是根據自己的使用經驗,結合一些例子,把一些常用的,有用的,而可能為許多初學者所不知的用法介紹了一點,希望大家不要笑話,也希望大家批評指正。
有人認為這種帶變參的函數會引起各種問題,因而不提倡使用。但筆者本人每每還是抵擋不了它們強大功能的誘惑,在實際工作中一直在使用。實際上,C#.NET從開始就支援變參,剛發布不久的Java5.0也支援變參了。
感謝ericzhangali(另一個空間)仔細審閱了全稿,糾正了很多小錯誤,並提出了一些建議。也感謝laomai(老邁)閱讀了全稿並給出了增刪一些內容的建議。
①擷取System時間: void GetSystemTime(LPSYSTEMTIME lpSystemTime); 下面是例子:
#include <windows.h>
#include <stdio.h>
#include <stdlib.h>
void main() {
SYSTEMTIME st; //定義存放時間的結構體
char strTime[256];
int n="0";
GetSystemTime(&st);
n = sprintf(strTime,"Year:\t%d\n",st.wYear);
n += sprintf(strTime+n,"Month:\t%d\n",st.wMonth);
n += sprintf(strTime+n,"Day:\t%d\n",st.wDay);
n += sprintf(strTime+n,"Date:\t%d\n",st.wDayOfWeek);
n += sprintf(strTime+n,"Hour:\t%d\n",st.wHour);
n += sprintf(strTime+n,"Minute:\t%d\n",st.wMinute);
n += sprintf(strTime+n,"Second:\t%d\n",st.wSecond);
n += sprintf(strTime+n,"MilliSecond:\t%d\n",st.wMilliseconds);
printf("%s",strTime);
system("pause");
}
******************************************
參量表是需要輸出的一系列參數, 其個數必須與格式化字串所說明的輸出
參數個數一樣多, 各參數之間用","分開, 且順序一一對應, 否則將會出現意想
不到的錯誤。
1. 格式化規定符
Turbo C2.0提供的格式化規定符如下:
━━━━━━━━━━━━━━━━━━━━━━━━━━
符號 作用
──────────────────────────
%d 十進位有符號整數
%u 十進位不帶正負號的整數
%f 浮點數
%s 字串
%c 單個字元
%p 指標的值
%e 指數形式的浮點數
%x, %X 無符號以十六進位表示的整數
%0 無符號以八進位表示的整數
%g 自動選擇合適的標記法
━━━━━━━━━━━━━━━━━━━━━━━━━━
說明:
(1). 可以在"%"和字母之間插進數字表示最大場寬。
例如: %3d 表示輸出3位整型數, 不夠3位靠右對齊。
%9.2f 表示輸出場寬為9的浮點數, 其中小數位為2, 整數位為6,
小數點佔一位, 不夠9位靠右對齊。
%8s 表示輸出8個字元的字串, 不夠8個字元靠右對齊。
如果字串的長度、或整型數位元超過說明的場寬, 將按其實際長度輸出。
但對浮點數, 若整數部分位元超過了說明的整數位寬度, 將按實際整數位輸出;
若小數部分位元超過了說明的小數位寬度, 則按說明的寬度以四捨五入輸出。
另外, 若想在輸出值前加一些0, 就應在場寬項前加個0。
例如: %04d 表示在輸出一個小於4位的數值時, 將在前面補0使其總寬度
為4位。
如果用浮點數表示字元或整型量的輸出格式, 小數點後的數字代表最大寬度,
小數點前的數字代表最小寬度。
例如: %6.9s 表示顯示一個長度不小於6且不大於9的字串。若大於9, 則
第9個字元以後的內容將被刪除。
(2). 可以在"%"和字母之間加小寫字母l, 表示輸出的是長型數。
例如: %ld 表示輸出long整數
%lf 表示輸出double浮點數
(3). 可以控制輸出靠左對齊或靠右對齊, 即在"%"和字母之間加入一個"-" 號可
說明輸出為靠左對齊, 否則為靠右對齊。
例如: %-7d 表示輸出7位整數靠左對齊
%-10s 表示輸出10個字元靠左對齊
2. 一些特殊規定字元
━━━━━━━━━━━━━━━━━━━━━━━━━━
字元 作用
──────────────────────────
\n 換行
\f 清屏並換頁
\r 斷行符號
\t Tab符
\xhh 表示一個ASCII碼用16進表示,
其中hh是1到2個16進位數
━━━━━━━━━━━━━━━━━━━━━━━━━━