預先處理
預先處理語句是一些行首以#開始的特殊語句,例如:#include,#define等就是預先處理語句。在編譯器的編譯過程中,進行其它編譯處理(詞法分析、文法分析、代碼產生、最佳化和串連等)之前,先進行這些語句的分析處理。預先處理語句使用的目的在於協助程式員編寫出易讀、易改、易移植並便於調試的程式。預先處理語句主要有三種:宏定義和宏替換、檔案包含、條件編譯。
預先處理語句的作用範圍是從被定義語句開始直至被解除定義或是到包含它的檔案結束為止均有效。宏只在compile-time之前用於編譯預先處理,因此程式中用#define定義的宏只在當前編譯單元.c/cpp中可用。而由compiler支援的外部宏在工程中所有的編譯單元中可用。
本章介紹常用的幾種預先處理功能。
宏定義
在C語言來源程式中允許用一個標識符來表示一個字串, 稱為“宏”。被定義為“宏”的標識符稱為“宏名”。在編譯預先處理時,對程式中所有出現的“宏名”,都用宏定義中的字串去代換, 這稱為“宏代換”或“宏展開”。
宏定義是由來源程式中的宏定義命令完成的。 宏代換是由預先處理程式自動完成的。在C語言中,“宏”分為有參數和無參數兩種。 下面分別討論這兩種“宏”的定義和調用。
無參宏定義
無參宏的宏名後不帶參數。其定義的一般形式為: #define 標識符 字串 其中的“#”表示這是一條預先處理命令。凡是以“#”開頭的均為預先處理命令。“define”為宏定義命令。 “標識符”為所定義的宏名。“字串”可以是常數、運算式、格式串等。在前面介紹過的符號常量的定義就是一種無參宏定義。 此外,常對程式中反覆使用的運算式進行宏定義。例如: # define M (y*y+3*y) 定義M運算式(y*y+3*y)。在編寫來源程式時,所有的(y*y+3*y)都可由M代替,而對來源程式作編譯時間,將先由預先處理程式進行宏代換,即用(y*y+3*y)運算式去置換所有的宏名M,然後再進行編譯。
#define M (y*y+3*y) main(){ int s,y; printf("input a number: "); scanf("%d",&y); s=3*M+4*M+5*M; printf("s=%d\n",s); } |
上常式序中首先進行宏定義,定義M運算式(y*y+3*y),在s= 3*M+4*M+5* M中作了宏調用。在預先處理時經宏展開後該語句變為:s=3*(y*y+3*y)+4(y*y+3*y)+5(y*y+3*y);但要注意的是,在宏定義中運算式(y*y+3*y)兩邊的括弧不能少。否則會發生錯誤。
當作以下定義後: #difine M y*y+3*y在宏展開時將得到下述語句: s=3*y*y+3*y+4*y*y+3*y+5*y*y+3*y;這相當於; 3y2+3y+4y2+3y+5y2+3y;顯然與原題意要求不符。計算結果當然是錯誤的。 因此在作宏定義時必須十分注意。應保證在宏代換之後不發生錯誤。對於宏定義還要說明以下幾點:
1. 宏定義是用宏名來表示一個字串,在宏展開時又以該字串取代宏名,這隻是一種簡單的代換,字串中可以含任何字元,可以是常數,也可以是運算式,預先處理程式對它不作任何檢查。如有錯誤,只能在編譯已被宏展開後的來源程式時發現。
2. 宏定義不是說明或語句,在行末不必加分號,如加上分號則連分號也一起置換。
3. 宏定義必須寫在函數之外,其範圍為宏定義命令起到來源程式結 束。如要終止其範圍可使用# undef命令,例如:
# define PI 3.14159 main() { …… } |
# undef PIPI的範圍
f1()
....表示PI只在main函數中有效,在f1中無效。
4. 宏名在來源程式中若用引號括起來,則預先處理程式不對其作宏代換。
#define OK 100 main() { printf("OK"); printf("\n"); } |
上例中定義宏名OK表示100,但在printf語句中OK被引號括起來,因此不作宏代換。程式的運行結果為:OK這表示把“OK”當字串處理。
5. 宏定義允許嵌套,在宏定義的字串中可以使用已經定義的宏名。在宏展開時由預先處理程式層層代換。例如:
#define PI 3.1415926 #define S PI*y*y /* PI是已定義的宏名*/對語句: printf("%f",s); |
在宏代換後變為: printf("%f",3.1415926*y*y);
6. 習慣上宏名用大寫字母表示,以便於與變數區別。但也允許用小寫字母。
7. 可用宏定義表示資料類型,使書寫方便。例如: #define STU struct stu在程式中可用STU作變數說明:
| STU body[5],*p;#define INTEGER int |
在程式中即可用INTEGER作整型變數說明: INTEGER a,b; 應注意用宏定義表示資料類型和用typedef定義資料說明符的區別。宏定義只是簡單的字串代換,是在預先處理完成的,而typedef是在編譯時間處理的,它不是作簡單的代換, 而是對類型說明符重新命名。被命名的標識符具有類型定義說明的功能。請看下面的例子: #define PIN1 int* typedef (int*) PIN2;從形式上看這兩者相似, 但在實際使用中卻不相同。下面用PIN1,PIN2說明變數時就可以看出它們的區別: PIN1 a,b;在宏代換後變成 int *a,b;表示a是指向整型的指標變數,而b是整型變數。然而:PIN2 a,b;表示a,b都是指向整型的指標變數。因為PIN2是一個類型說明符。由這個例子可見,宏定義雖然也可表示資料類型, 但畢竟是作字元代換。在使用時要分外小心,以避出錯。
8. 對“輸出格式”作宏定義,可以減少書寫麻煩。例9.3 中就採用了這種方法。
#define P printf #define D "%d\n" #define F "%f\n" main(){ int a=5, c=8, e=11; float b=3.8, d=9.7, f=21.08; P(D F,a,b); P(D F,c,d); P(D F,e,f); } |
上常式序中首先進行宏定義,定義M運算式(y*y+3*y),在s= 3*M+4*M+5* M中作了宏調用。在預先處理時經宏展開後該語句變為:s=3*(y*y+3*y)+4(y*y+3*y)+5(y*y+3*y);但要注意的是,在宏定義中運算式(y*y+3*y)兩邊的括弧不能少。否則會發生錯誤。 當作以下定義後: #difine M y*y+3*y在宏展開時將得到下述語句: s=3*y*y+3*y+4*y*y+3*y+5*y*y+3*y;這相當於; 3y2+3y+4y2+3y+5y2+3y;顯然與原題意要求不符。計算結果當然是錯誤的。 因此在作宏定義時必須十分注意。應保證在宏代換之後不發生錯誤。對於宏定義還要說明以下幾點: 1. 宏定義是用宏名來表示一個字串,在宏展開時又以該字串取代宏名,這隻是一種簡單的代換,字串中可以含任何字元,可以是常數,也可以是運算式,預先處理程式對它不作任何檢查。如有錯誤,只能在編譯已被宏展開後的來源程式時發現。 2. 宏定義不是說明或語句,在行末不必加分號,如加上分號則連分號也一起置換。 3. 宏定義必須寫在函數之外,其範圍為宏定義命令起到來源程式結 束。如要終止其範圍可使用# undef命令,例如: # undef PIPI的範圍 f1() ....表示PI只在main函數中有效,在f1中無效。 4. 宏名在來源程式中若用引號括起來,則預先處理程式不對其作宏代換。 上例中定義宏名OK表示100,但在printf語句中OK被引號括起來,因此不作宏代換。程式的運行結果為:OK這表示把“OK”當字串處理。 5. 宏定義允許嵌套,在宏定義的字串中可以使用已經定義的宏名。在宏展開時由預先處理程式層層代換。例如: 在宏代換後變為: printf("%f",3.1415926*y*y); 6. 習慣上宏名用大寫字母表示,以便於與變數區別。但也允許用小寫字母。 7. 可用宏定義表示資料類型,使書寫方便。例如: #define STU struct stu在程式中可用STU作變數說明: 在程式中即可用INTEGER作整型變數說明: INTEGER a,b; 應注意用宏定義表示資料類型和用typedef定義資料說明符的區別。宏定義只是簡單的字串代換,是在預先處理完成的,而typedef是在編譯時間處理的,它不是作簡單的代換, 而是對類型說明符重新命名。被命名的標識符具有類型定義說明的功能。請看下面的例子: #define PIN1 int* typedef (int*) PIN2;從形式上看這兩者相似, 但在實際使用中卻不相同。下面用PIN1,PIN2說明變數時就可以看出它們的區別: PIN1 a,b;在宏代換後變成 int *a,b;表示a是指向整型的指標變數,而b是整型變數。然而:PIN2 a,b;表示a,b都是指向整型的指標變數。因為PIN2是一個類型說明符。由這個例子可見,宏定義雖然也可表示資料類型, 但畢竟是作字元代換。在使用時要分外小心,以避出錯。 8. 對“輸出格式”作宏定義,可以減少書寫麻煩。例9.3 中就採用了這種方法。
帶參宏定義
C語言允許宏帶有參數。在宏定義中的參數稱為形式參數, 在宏調用中的參數稱為實際參數。對帶參數的宏,在調用中,不僅要宏展開, 而且要用實參去代換形參。
帶參宏定義的一般形式為: #define 宏名(形參表) 字串 在字串中含有各個形參。帶參宏調用的一般形式為: 宏名(實參表);
例如:
#define M(y) y*y+3*y /*宏定義*/ : k=M(5); /*宏調用*/ : 在宏調用時,用實參5去代替形參y, 經預先處理宏展開後的語句 為: k=5*5+3*5 #define MAX(a,b) (a>b)?a:b main(){ int x,y,max; printf("input two numbers: "); scanf("%d%d",&x,&y); max=MAX(x,y); printf("max=%d\n",max); } |
上常式序的第一行進行帶參宏定義,用宏名MAX表示條件運算式(a>b)?a:b,形參a,b均出現在條件運算式中。程式第七行max=MAX(x,
y)為宏調用,實參x,y,將代換形參a,b。宏展開後該語句為: max=(x>y)?x:y;用於計算x,y中的大數。對於帶參的宏定義有以下問題需要說明:
1. 帶參宏定義中,宏名和形參表之間不能有空格出現。
例如把: #define MAX(a,b) (a>b)?a:b寫為: #define MAX (a,b) (a>b)?a:b 將被認為是無參宏定義,宏名MAX代表字串 (a,b)(a>b)?a:b。
宏展開時,宏調用語句: max=MAX(x,y);將變為: max=(a,b)(a>b)?a:b(x,y);這顯然是錯誤的。
2. 在帶參宏定義中,形式參數不分配記憶體單元,因此不必作類型定義。而宏調用中的實參有具體的值。要用它們去代換形參,因此必須作類型說明。這是與函數中的情況不同的。在函數中,形參和實參是兩個不同的量,各有自己的範圍,調用時要把實參值賦予形參,進行“值傳遞”。而在帶參宏中,只是符號代換,不存在值傳遞的問題。
3. 在宏定義中的形參是標識符,而宏調用中的實參可以是運算式。
#define SQ(y) (y)*(y) main(){ int a,sq; printf("input a number: "); scanf("%d",&a); sq=SQ(a+1); printf("sq=%d\n",sq); } |
上例中第一行為宏定義,形參為y。程式第七行宏調用中實參為a+1,是一個運算式,在宏展開時,用a+1代換y,再用(y)*(y) 代換SQ,得到如下語句: sq=(a+1)*(a+1); 這與函數的調用是不同的, 函數調用時要把實參運算式的值求出來再賦予形參。 而宏代換中對實參運算式不作計算直接地照原樣代換。
4. 在宏定義中,字串內的形參通常要用括弧括起來以避免出錯。 在上例中的宏定義中(y)*(y)運算式的y都用括弧括起來,因此結果是正確的。如果去掉括弧,把程式改為以下形式:
#define SQ(y) y*y main(){ int a,sq; printf("input a number: "); scanf("%d",&a); sq=SQ(a+1); printf("sq=%d\n",sq); } |
運行結果為:input a number:3
sq=7 同樣輸入3,但結果卻是不一樣的。問題在哪裡呢? 這是由於代換隻作符號代換而不作其它處理而造成的。 宏代換後將得到以下語句: sq=a+1*a+1; 由於a為3故sq的值為7。這顯然與題意相違,因此參數兩邊的括弧是不能少的。即使在參數兩邊加括弧還是不夠的,請看下面程式:
#define SQ(y) (y)*(y) main(){ int a,sq; printf("input a number: "); scanf("%d",&a); sq=160/SQ(a+1); printf("sq=%d\n",sq); } |
本程式與前例相比,只把宏調用語句改為: sq=160/SQ(a+1); 運行本程式如輸入值仍為3時,希望結果為10。但實際啟動並執行結果如下:input a number:3 sq=160為什麼會得這樣的結果呢?分析宏調用語句,在宏代換之後變為: sq=160/(a+1)*(a+1);a為3時,由於“/”和“*”運算子優先順序和結合性相同, 則先作160/(3+1)得40,再作40*(3+1)最後得160。為了得到正確答案應在宏定義中的整個字串外加括弧, 程式修改如下
#define SQ(y) ((y)*(y)) main(){ int a,sq; printf("input a number: "); scanf("%d",&a); sq=160/SQ(a+1); printf("sq=%d\n",sq); } |
以上討論說明,對於宏定義不僅應在參數兩側加括弧, 也應在整個字串外加括弧。
5. 帶參的宏和帶參函數很相似,但有本質上的不同,除上面已談到的各點外,把同一運算式用函數處理與用宏處理兩者的結果有可能是不同的。
main(){ int i=1; while(i<=5) printf("%d\n",SQ(i++)); } SQ(int y) { return((y)*(y)); }#define SQ(y) ((y)*(y)) main(){ int i=1; while(i<=5) printf("%d\n",SQ(i++)); } |
在上例中函數名為SQ,形參為Y,函數體運算式為((y)*(y))。在例9.6中宏名為SQ,形參也為y,字串運算式為(y)*(y))。 兩例是相同的。例9.6的函數調用為SQ(i++),例9.7的宏調用為SQ(i++),實參也是相同的。從輸出結果來看,卻大不相同。分析如下:在例9.6中,函數調用是把實參i值傳給形參y後自增1。 然後輸出函數值。因而要迴圈5次。輸出1~5的平方值。而在例9.7中宏調用時,只作代換。SQ(i++)被代換為((i++)*(i++))。在第一次迴圈時,由於i等於1,其計算過程為:運算式中前一個i初值為1,然後i自增1變為2,因此運算式中第2個i初值為2,兩相乘的結果也為2,然後i值再自增1,得3。在第二次迴圈時,i值已有初值為3,因此運算式中前一個i為3,後一個i為4, 乘積為12,然後i再自增1變為5。進入第三次迴圈,由於i 值已為5,所以這將是最後一次迴圈。計算運算式的值為5*6等於30。i值再自增1變為6,不再滿足迴圈條件,停止迴圈。從以上分析可以看出函數調用和宏調用二者在形式上相似, 在本質上是完全不同的。
6. 宏定義也可用來定義多個語句,在宏調用時,把這些語句又代換到來源程式內。看下面的例子。
#define SSSV(s1,s2,s3,v) s1=l*w;s2=l*h;s3=w*h;v=w*l*h; main(){ int l=3,w=4,h=5,sa,sb,sc,vv; SSSV(sa,sb,sc,vv); printf("sa=%d\nsb=%d\nsc=%d\nvv=%d\n",sa,sb,sc,vv); } |
程式第一行為宏定義,用宏名SSSV表示4個指派陳述式,4 個形參分別為4個賦值符左部的變數。在宏調用時,把4 個語句展開並用實參代替形參。使計算結果送入實參之中。
檔案包含
檔案包含是C預先處理程式的另一個重要功能。檔案包含命令列的一般形式為: #include"檔案名稱" 在前面我們已多次用此命令包含過庫函數的標頭檔。例如:
#include"stdio.h" #include"math.h" |
檔案包含命令的功能是把指定的檔案插入該命令列位置取代該命令列, 從而把指定的檔案和當前的來源程式檔案連成一個源檔案。在程式設計中,檔案包含是很有用的。 一個大的程式可以分為多個模組,由多個程式員分別編程。 有些公用的符號常量或宏定義等可單獨組成一個檔案, 在其它檔案的開頭用包含命令包含該檔案即可使用。這樣,可避免在每個檔案開頭都去書寫那些公用量, 從而節省時間,並減少出錯。
對檔案包含命令還要說明以下幾點:
1. 包含命令中的檔案名稱可以用雙引號括起來,也可以用角括弧括起來。例如以下寫法都是允許的: #include"stdio.h" #include<math.h> 但是這兩種形式是有區別的:使用角括弧表示在包含檔案目錄中去尋找(包含目錄是由使用者在設定環境時設定的), 而不在源檔案目錄去尋找; 使用雙引號則表示首先在當前的源檔案目錄中尋找,若未找到才到包含目錄中去尋找。 使用者編程時可根據自己檔案所在的目錄來選擇某一種命令形式。
2. 一個include命令只能指定一個被包含檔案, 若有多個檔案要包含,則需用多個include命令。3. 檔案包含允許嵌套,即在一個被包含的檔案中又可以包含另一個檔案。
條件編譯
預先處理程式提供了條件編譯的功能。 可以按不同的條件去編譯不同的程式部分,因而產生不同的目標代碼檔案。 這對於程式的移植和調試是很有用的。 條件編譯有三種形式,下面分別介紹:
1. 第一種形式:
#ifdef 標識符 程式段1 #else 程式段2 #endif |
它的功能是,如果標識符已被 #define命令定義過則對程式段1進行編譯;否則對程式段2進行編譯。如果沒有程式段2(它為空白),本格式中的#else可以沒有, 即可以寫為:
#ifdef 標識符 程式段 #endif #define NUM ok main(){ struct stu { int num; char *name; char sex; float score; } *ps; ps=(struct stu*)malloc(sizeof(struct stu)); ps->num=102; ps->name="Zhang ping"; ps->sex='M'; ps->score=62.5; #ifdef NUM printf("Number=%d\nScore=%f\n",ps->num,ps->score); #else printf("Name=%s\nSex=%c\n",ps->name,ps->sex); #endif free(ps); } |
由於在程式的第16行插入了條件編譯預先處理命令, 因此要根據NUM是否被定義過來決定編譯那一個printf語句。而在程式的第一行已對NUM作過宏定義,因此應對第一個printf語句作編譯故運行結果是輸出了學號和成績。在程式的第一行宏定義中,定義NUM表示字串OK,其實也可以為任何字串,甚至不給出任何字串,寫為: #define NUM 也具有同樣的意義。 只有取消程式的第一行才會去編譯第二個printf語句。讀者可上機試作。
2. 第二種形式:
#ifndef 標識符 程式段1 #else 程式段2 #endif |
與第一種形式的區別是將“ifdef”改為“ifndef”。它的功能是,如果標識符未被#define命令定義過則對程式段1進行編譯, 否則對程式段2進行編譯。這與第一種形式的功能正相反。
3. 第三種形式:
#if 常量運算式 程式段1 #else 程式段2 #endif |
它的功能是,如常量運算式的值為真(非0),則對程式段1 進行編譯,否則對程式段2進行編譯。因此可以使程式在不同條件下,完成不同的功能
#define R 1 main(){ float c,r,s; printf ("input a number: "); scanf("%f",&c); #if R r=3.14159*c*c; printf("area of round is: %f\n",r); #else s=c*c; printf("area of square is: %f\n",s); #endif } |
本例中採用了第三種形式的條件編譯。在程式第一行宏定義中,定義R為1,因此在條件編譯時間,常量運算式的值為真, 故計算並輸出圓面積。上面介紹的條件編譯當然也可以用條件陳述式來實現。 但是用條件陳述式將會對整個來源程式進行編譯,產生的目標代碼程式很長,而採用條件編譯,則根據條件只編譯其中的程式段1或程式段2, 產生的目標程式較短。如果條件選擇的程式段很長, 採用條件編譯的方法是十分必要的。