C++中的標頭檔和源檔案

來源:互聯網
上載者:User

http://www.cnblogs.com/lidabo/archive/2012/04/17/2454568.html 

一、C++編譯模式
通常,在一個C++程式中,只包含兩類檔案——.cpp檔案和.h檔案。其中,.cpp檔案被稱作C++源檔案,裡面放的都是C++的原始碼;而.h檔案則被稱作C++標頭檔,裡面放的也是C++的原始碼。
C+ +語言支援“分別編譯”(separate compilation)。也就是說,一個程式所有的內容,可以分成不同的部分分別放在不同的.cpp檔案裡。.cpp檔案裡的東西都是相對獨立的,在編 譯(compile)時不需要與其他檔案互連,只需要在編譯成目標檔案後再與其他的目標檔案做一次連結(link)就行了。比如,在檔案a.cpp中定義 了一個全域函數“void a() {}”,而在檔案b.cpp中需要調用這個函數。即使這樣,檔案a.cpp和檔案b.cpp並不需要相互知道對方的存在,而是可以分別地對它們進行編譯, 編譯成目標檔案之後再連結,整個程式就可以運行了。
這是怎麼實現的呢?從寫程式的角度來講,很簡單。在檔案b.cpp中,在調用 “void a()”函數之前,先聲明一下這個函數“void a();”,就可以了。這是因為編譯器在編譯b.cpp的時候會產生一個符號表(symbol table),像“void a()”這樣的看不到定義的符號,就會被存放在這個表中。再進行連結的時候,編譯器就會在別的目標檔案中去尋找這個符號的定義。一旦找到了,程式也就可以 順利地產生了。
注意這裡提到了兩個概念,一個是“定義”,一個是“聲明”。簡單地說,“定義”就是把一個符號完完整整地描述出來:它是變 量還是函數,返回什麼類型,需要什麼參數等等。而“聲明”則只是聲明這個符號的存在,即告訴編譯器,這個符號是在其他檔案中定義的,我這裡先用著,你連結 的時候再到別的地方去找找看它到底是什麼吧。定義的時候要按C++文法完整地定義一個符號(變數或者函數),而聲明的時候就只需要寫出這個符號的原型了。 需要注意的是,一個符號,在整個程式中可以被聲明多次,但卻要且僅要被定義一次。試想,如果一個符號出現了兩種不同的定義,編譯器該聽誰的?
這 種機制給C++程式員們帶來了很多好處,同時也引出了一種編寫程式的方法。考慮一下,如果有一個很常用的函數“void f() {}”,在整個程式中的許多.cpp檔案中都會被調用,那麼,我們就只需要在一個檔案中定義這個函數,而在其他的檔案中聲明這個函數就可以了。一個函數還 好對付,聲明起來也就一句話。但是,如果函數多了,比如是一大堆的數學函數,有好幾百個,那怎麼辦?能保證每個程式員都可以完完全全地把所有函數的形式都 準確地記下來並寫出來嗎?
二、什麼是標頭檔
很顯然,答案是不可能。但是有一個很簡單地辦法,可以協助程式員們省去記住那麼多函數原型的麻煩:我們可以把那幾百個函數的聲明語句全都先寫好,放在一個檔案裡,等到程式員需要它們的時候,就把這些東西全部copy進他的原始碼中。
這 個方法固然可行,但還是太麻煩,而且還顯得很笨拙。於是,標頭檔便可以發揮它的作用了。所謂的標頭檔,其實它的內容跟.cpp檔案中的內容是一樣的,都是 C++的原始碼。但標頭檔不用被編譯。我們把所有的函式宣告全部放進一個標頭檔中,當某一個.cpp源檔案需要它們時,它們就可以通過一個宏命令 “#include”包含進這個.cpp檔案中,從而把它們的內容合并到.cpp檔案中去。當.cpp檔案被編譯時間,這些被包含進去的.h檔案的作用便發 揮了。
舉一個例子吧,假設所有的數學函數只有兩個:f1和f2,那麼我們把它們的定義放在math.cpp裡:
/* math.cpp */
double f1()
{
    //do something here....
    return;
}
double f2(double a)
{
    //do something here...
    return a * a;
}
/* end of math.cpp */
並把“這些”函數的聲明放在一個標頭檔math.h中:
/* math.h */
double f1();
double f2(double);
/* end of math.h */
在另一個檔案main.cpp中,我要調用這兩個函數,那麼就只需要把標頭檔包含進來:
/* main.cpp */
#include "math.h"
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of main.cpp */
這 樣,便是一個完整的程式了。需要注意的是,.h檔案不用寫在編譯器的命令之後,但它必須要在編譯器找得到的地方(比如跟main.cpp在一個目錄下)。 main.cpp和math.cpp都可以分別通過編譯,產生main.o和math.o,然後再把這兩個目標檔案進行連結,程式就可以運行了。
三、#include
#include 是一個來自C語言的宏命令,它在編譯器進行編譯之前,即在先行編譯的時候就會起作用。#include的作用是把它後面所寫的那個檔案的內容,完完整整地、 一字不改地包含到當前的檔案中來。值得一提的是,它本身是沒有其它任何作用與副功能的,它的作用就是把每一個它出現的地方,替換成它後面所寫的那個檔案的 內容。簡單的文本替換,別無其他。因此,main.cpp檔案中的第一句(#include "math.h"),在編譯之前就會被替換成math.h檔案的內容。即在編譯過程將要開始的時候,main.cpp的內容已經發生了改變:
/* ~main.cpp */
double f1();
double f2(double);
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of ~main.cpp */
不多不少,剛剛好。同理可知,如果我們除了main.cpp以外,還有其他的很多.cpp檔案也用到了f1和f2函數的話,那麼它們也通通只需要在使用這兩個函數前寫上一句#include "math.h"就行了。
四、標頭檔中應該寫什麼
通 過上面的討論,我們可以瞭解到,標頭檔的作用就是被其他的.cpp包含進去的。它們本身並不參與編譯,但實際上,它們的內容卻在多個.cpp檔案中得到了 編譯。通過“定義只能有一次”的規則,我們很容易可以得出,標頭檔中應該只放變數和函數的聲明,而不能放它們的定義。因為一個標頭檔的內容實際上是會被引 入到多個不同的.cpp檔案中的,並且它們都會被編譯。放聲明當然沒事,如果放了定義,那麼也就相當於在多個檔案中出現了對於一個符號(變數或函數)的定 義,縱然這些定義都是相同的,但對於編譯器來說,這樣做不合法。
所以,應該記住的一點就是,.h標頭檔中,只能存在變數或者函數的聲明, 而不要放定義。即,只能在標頭檔中寫形如:extern int a;和void f();的句子。這些才是聲明。如果寫上int a;或者void f() {}這樣的句子,那麼一旦這個標頭檔被兩個或兩個以上的.cpp檔案包含的話,編譯器會立馬報錯。(關於extern,前面有討論過,這裡不再討論定義跟 聲明的區別了。)
但是,這個規則是有三個例外的。
一,標頭檔中可以寫const對象的定義。因為全域的const對象默 認是沒有extern的聲明的,所以它只在當前檔案中有效。把這樣的對象寫進標頭檔中,即使它被包含到其他多個.cpp檔案中,這個對象也都只在包含它的 那個檔案中有效,對其他檔案來說是不可見的,所以便不會導致多重定義。同時,因為這些.cpp檔案中的該對象都是從一個標頭檔中包含進去的,這樣也就保證 了這些.cpp檔案中的這個const對象的值是相同的,可謂一舉兩得。同理,static對象的定義也可以放進標頭檔。
二,標頭檔中可 以寫內嵌函式(inline)的定義。因為inline函數是需要編譯器在遇到它的地方根據它的定義把它內聯展開的,而並非是普通函數那樣可以先聲明再鏈 接的(內嵌函式不會連結),所以編譯器就需要在編譯時間看到內嵌函式的完整定義才行。如果內嵌函式像普通函數一樣只能定義一次的話,這事兒就難辦了。因為在 一個檔案中還好,我可以把內嵌函式的定義寫在最開始,這樣可以保證後面使用的時候都可以見到定義;但是,如果我在其他的檔案中還使用到了這個函數那怎麼辦 呢?這幾乎沒什麼太好的解決辦法,因此C++規定,內嵌函式可以在程式中定義多次,只要內嵌函式在一個.cpp檔案中只出現一次,並且在所有的.cpp文 件中,這個內嵌函式的定義是一樣的,就能通過編譯。那麼顯然,把內嵌函式的定義放進一個標頭檔中是非常明智的做法。
三,標頭檔中可以寫類 (class)的定義。因為在程式中建立一個類的對象時,編譯器只有在這個類的定義完全可見的情況下,才能知道這個類的對象應該如何布局,所以,關於類的 定義的要求,跟內嵌函式是基本一樣的。所以把類的定義放進標頭檔,在使用到這個類的.cpp檔案中去包含這個標頭檔,是一個很好的做法。在這裡,值得一提 的是,類的定義中包含著資料成員和函數成員。資料成員是要等到具體的對象被建立時才會被定義(分配空間),但函數成員卻是需要在一開始就被定義的,這也就 是我們通常所說的類的實現。一般,我們的做法是,把類的定義放在標頭檔中,而把函數成員的實現代碼放在一個.cpp檔案中。這是可以的,也是很好的辦法。 不過,還有另一種辦法。那就是直接把函數成員的實現代碼也寫進類定義裡面。在C++的類中,如果函數成員在類的定義體中被定義,那麼編譯器會視這個函數為 內聯的。因此,把函數成員的定義寫進類定義體,一起放進標頭檔中,是合法的。注意一下,如果把函數成員的定義寫在類定義的標頭檔中,而沒有寫進類定義中, 這是不合法的,因為這個函數成員此時就不是內聯的了。一旦標頭檔被兩個或兩個以上的.cpp檔案包含,這個函數成員就被重定義了。
五、標頭檔中的保護措施
考 慮一下,如果標頭檔中只包含聲明語句的話,它被同一個.cpp檔案包含再多次都沒問題——因為聲明語句的出現是不受限制的。然而,上面討論到的標頭檔中的 三個例外也是標頭檔很常用的一個用處。那麼,一旦一個標頭檔中出現了上面三個例外中的任何一個,它再被一個.cpp包含多次的話,問題就大了。因為這三個 例外中的文法元素雖然“可以定義在多個源檔案中”,但是“在一個源檔案中只能出現一次”。設想一下,如果a.h中含有類A的定義,b.h中含有類B的定 義,由於類B的定義依賴了類A,所以b.h中也#include了a.h。現在有一個源檔案,它同時用到了類A和類B,於是程式員在這個源檔案中既把 a.h包含進來了,也把b.h包含進來了。這時,問題就來了:類A的定義在這個源檔案中出現了兩次!於是整個程式就不能通過編譯了。你也許會認為這是程式 員的失誤——他應該知道b.h包含了a.h——但事實上他不應該知道。
使用"#define"配合條件編譯可以很好地解決這個問題。在一 個標頭檔中,通過#define定義一個名字,並且通過條件編譯#ifndef...#endif使得編譯器可以根據這個名字是否被定義,再決定要不要繼 續編譯該頭文中後續的內容。這個方法雖然簡單,但是寫標頭檔時一定記得寫進去。

 分類: C++

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.