1、 聲明外部變數
現代編譯器一般採用按檔案編譯的方式,因此在編譯時間,各個檔案中定義的全域變數是
互相透明的,也就是說,在編譯時間,全域變數的可見域限制在檔案內部。下面舉一個簡單的例子。建立一個工程,裡面含有A.cpp和B.cpp兩個簡單的C++源檔案:
//A.cpp
int i;
void main()
{
}
//B.cpp
int i;
這兩個檔案極為簡單,在A.cpp中我們定義了一個全域變數i,在B中我們也定義了一個全域變數i。
我們對A和B分別編譯,都可以正常通過編譯,但是進行連結的時候,卻出現了錯誤,錯誤提示如下:
Linking...
B.obj : error LNK2005: "int i" (?i@@3HA) already defined in A.obj
Debug/A.exe : fatal error LNK1169: one or more multiply defined symbols found
Error executing link.exe.
A.exe - 2 error(s), 0 warning(s)
這就是說,在編譯階段,各個檔案中定義的全域變數相互是透明的,編譯A時覺察不到B中也定義了i,同樣,編譯B時覺察不到A中也定義了i。
但是到了連結階段,要將各個檔案的內容“合為一體”,因此,如果某些檔案中定義的全域變數名相同的話,在這個時候就會出現錯誤,也就是上面提示的重複定義的錯誤。
因此,各個檔案中定義的全域變數名不可相同。
在連結階段,各個檔案的內容(實際是編譯產生的obj檔案)是被合并到一起的,因而,定義於某檔案內的全域變數,在連結完成後,它的可見範圍被擴大到了整個程式。
這樣一來,按道理說,一個檔案中定義的全域變數,可以在整個程式的任何地方被使用,舉例說,如果A檔案中定義了某全域變數,那麼B檔案中應可以使用該變數。修改我們的程式,加以驗證:
//A.cpp
void main()
{
i = 100; //試圖使用B中定義的全域變數
}
//B.cpp
int i;
編譯結果如下:
Compiling...
A.cpp
C:\Documents and Settings\wangjian\案頭\try extern\A.cpp(5) : error C2065: 'i' : undeclared identifier
Error executing
cl.exe.
A.obj - 1 error(s), 0 warning(s)
編譯錯誤。
其實出現這個錯誤是意料之中的,因為:檔案中定義的全域變數的可見度擴充到整個程式是在連結完成之後,而在編譯階段,他們的可見度仍局限於各自的檔案。
編譯器的目光不夠長遠,編譯器沒有能夠意識到,某個變數符號雖然不是本檔案定義的,但是它可能是在其它的檔案中定義的。
雖然編譯器不夠遠見,但是我們可以給它提示,協助它來解決上面出現的問題。這就是extern的作用了。
extern的原理很簡單,就是告訴編譯器:“你現在編譯的檔案中,有一個標識符雖然沒有在本檔案中定義,但是它是在別的檔案中定義的全域變數,你要允許存取!”
我們為上面的錯誤程式加上extern關鍵字:
//A.cpp
extern int i;
void main()
{
i = 100; //試圖使用B中定義的全域變數
}
//B.cpp
int i;
順利通過編譯,連結。
編輯本段函數
extern
函數1
常見extern放在函數的前面成為函式宣告的一部分,那麼,C語言的關鍵字extern在函數的聲明中起什麼作用?
答案與分析:
如果函數的聲明中帶有關鍵字extern,僅僅是暗示這個函數可能在別的源檔案裡定義,沒有其它作用。即下述兩個函式宣告沒有明顯的區別:
extern int f(); 和int f();
當然,這樣的用處還是有的,就是在程式中取代include “*.h”來聲明函數,在一些複雜的項目中,我比較習慣在所有的函式宣告前添加extern修飾。
extern 函數2
當函數提供方單方面修改函數原型時,如果使用方不知情繼續沿用原來的extern申明,這樣編譯時間編譯器不會報錯。但是在運行過程中,因為少了或者多了輸入參數,往往會造成系統錯誤,這種情況應該如何解決?
答案與分析:
目前業界針對這種情況的處理沒有一個很完美的方案,通常的做法是提供方在自己的xxx_pub.h中提供對外部介面的聲明,然後調用包涵該檔案的標頭檔,從而省去extern這一步。以避免這種錯誤。
寶劍有雙鋒,對extern的應用,不同的場合應該選擇不同的做法。
extern “C”
在C++環境下使用C函數的時候,常常會出現編譯器無法找到obj模組中的C函數定義,從而導致連結失敗的情況,應該如何解決這種情況呢?
答案與分析:
C++語言在編譯的時候為瞭解決函數的多態問題,會將函數名和參數聯合起來產生一個中間的函數名稱,而C語言則不會,因此會造成連結時找不到對應函數的情況,此時C函數就需要用extern “C”進行連結指定,這告訴編譯器,請保持我的名稱,不要給我產生用於連結的中間函數名。
下面是一個標準的寫法:
//在.h檔案的頭上
#ifdef __cplusplus
#if __cplusplus
extern "C"{
#endif
#endif /* __cplusplus */
…
…
//.h檔案結束的地方
#ifdef __cplusplus
#if __cplusplus
}
#endif
#endif /* __cplusplus */
C++中extern c的深層探索
C++語言的建立初衷是“a better C”,但是這並不意味著C++中類似C語言的全域變數和函數所採用的編譯和串連方式與C語言完全相同。作為一種欲與C相容的語言,C++保留了一部分過程式語言的特點(被世人稱為“不徹底地物件導向”),因而它可以定義不屬於任何類的全域變數和函數。但是,C++畢竟是一種物件導向的程式設計語言,為了支援函數的重載,C++對全域函數的處理方式與C有明顯的不同。
2.從標準標頭檔說起
某企業曾經給出如下的一道面試題:
面試題
為什麼標準標頭檔都有類似以下的結構?
#ifndef __INCvxWorksh
#define __INCvxWorksh
#ifdef __cplusplus
extern "C" {
#endif
/*...*/
#ifdef __cplusplus
}
#endif
#endif /* __INCvxWorksh */
分析
顯然,標頭檔中的編譯宏“#ifndef __INCvxWorksh、#define __INCvxWorksh、#endif” 的作用是防止該標頭檔被重複引用。
那麼
#ifdef __cplusplus
extern "C" {
#endif
#ifdef __cplusplus
}
#endif
的作用又是什麼呢?我們將在下文一一道來。
3.深層揭密extern "C"
extern "C" 包含雙重含義,從字面上即可得到:首先,被它修飾的目標是“extern”的;其次,被它修飾的目標是“C”的。讓我們來詳細解讀這兩重含義。
被extern "C"限定的函數或變數是extern類型的;
extern是C/C++語言中表明函數和全域變數作用範圍(可見度)的關鍵字,該關鍵字告訴編譯器,其聲明的函數和變數可以在本模組或其它模組中使用。記住,下列語句:
extern int a;
僅僅是一個變數的聲明,其並不是在定義變數a,並未為a分配記憶體空間。變數a在所有模組中作為一種全域變數只能被定義一次,否則會出現串連錯誤。
引用一個定義在其它模組的全域變數或函數(如,全域函數或變數定義在A模組,B欲引用)有兩種方法,一、B模組中include模組A的標頭檔。二、模組B中對欲引用的模組A的變數或函數重新聲明一遍,並前加extern關鍵字。
通常,在模組的標頭檔中對本模組提供給其它模組引用的函數和全域變數以關鍵字extern聲明。例如,如果模組B欲引用該模組A中定義的全域變數和函數時只需包含模組A的標頭檔即可。這樣,模組B中調用模組A中的函數時,在編譯階段,模組B雖然找不到該函數,但是並不會報錯;它會在串連階段中從模組A編譯產生的目標代碼中找到此函數。
與extern對應的關鍵字是static,被它修飾的全域變數和函數只能在本模組中使用。因此,一個函數或變數只可能被本模組使用時,其不可能被extern “C”修飾。
被extern "C"修飾的變數和函數是按照C語言方式編譯和串連的;
未加extern “C”聲明時的編譯方式
首先看看C++中對類似C的函數是怎樣編譯的。
作為一種物件導向的語言,C++支援函數重載,而過程式語言C則不支援。函數被C++編譯後在符號庫中的名字與C語言的不同。例如,假設某個函數的原型為:
void foo( int x, int y );
該函數被C編譯器編譯後在符號庫中的名字為_foo,而C++編譯器則會產生像_foo_int_int之類的名字(不同的編譯器可能產生的名字不同,但是都採用了相同的機制,產生的新名字稱為“mangled name”)。
_foo_int_int這樣的名字包含了函數名、函數參數數量及類型資訊,C++就是靠這種機制來實現函數重載的。例如,在C++中,函數void foo( int x, int y )與void foo( int x, float y )編譯產生的符號是不相同的,後者為_foo_int_float。
同樣地,C++中的變數除支援局部變數外,還支援類成員變數和全域變數。使用者所編寫程式的類成員變數可能與全域變數同名,我們以"."來區分。而本質上,編譯器在進行編譯時間,與函數的處理相似,也為類中的變數取了一個獨一無二的名字,這個名字與使用者程式中同名的全域變數名字不同。
未加extern "C"聲明時的串連方式
假設在C++中,模組A的標頭檔如下:
// 模組A標頭檔 moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
int foo( int x, int y );
#endif
在模組B中引用該函數:
// 模組B實現檔案 moduleB.cpp
#include "moduleA.h"
foo(2,3);
實際上,在串連階段,連接器會從模組A產生的目標檔案moduleA.obj中尋找_foo_int_int這樣的符號!
加extern "C"聲明後的編譯和串連方式
加extern "C"聲明後,模組A的標頭檔變為:
// 模組A標頭檔 moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
extern "C" int foo( int x, int y );
#endif
在模組B的實現檔案中仍然調用foo( 2,3 ),其結果是:
(1)模組A編譯產生foo的目標代碼時,沒有對其名字進行特殊處理,採用了C語言的方式;
(2)連接器在為模組B的目標代碼尋找foo(2,3)調用時,尋找的是未經修改的符號名_foo。
如果在模組A中函式宣告了foo為extern "C"類型,而模組B中包含的是extern int foo( int x, int y ) ,則模組B找不到模組A中的函數;反之亦然。
所以,可以用一句話概括extern “C”這個聲明的真實目的(任何語言中的任何文法特性的誕生都不是隨意而為的,來源於真實世界的需求驅動。我們在思考問題時,不能只停留在這個語言是怎麼做的,還要問一問它為什麼要這麼做,動機是什麼,這樣我們可以更深入地理解許多問題):
實現C++與C及其它語言的混合編程。
明白了C++中extern "C"的設立動機,我們下面來具體分析extern "C"通常的提示。
4.extern "C"的慣用法
(1)在C++中引用C語言中的函數和變數,在包含C語言標頭檔(假設為cExample.h)時,需進行下列處理:
extern "C"
{
#include "cExample.h"
}
而在C語言的標頭檔中,對其外部函數只能指定為extern類型,C語言中不支援extern "C"聲明,在.c檔案中包含了extern "C"時會出現編譯語法錯誤。
筆者編寫的C++引用C函數例子工程中包含的三個檔案的原始碼如下:
/* c語言標頭檔:cExample.h */
#ifndef C_EXAMPLE_H
#define C_EXAMPLE_H
extern int add(int x,int y);
#endif
/* c語言實現檔案:cExample.c */
#include "cExample.h"
int add( int x, int y )
{
return x + y;
}
// c++實現檔案,調用add:cppFile.cpp
extern "C"
{
#include "cExample.h"
}
int main(int argc, char* argv[])
{
add(2,3);
return 0;
}
如果C++調用一個C語言編寫的.DLL時,當包括.DLL的標頭檔或聲明介面函數時,應加extern "C" { }。
(2)在C++引用C語言中的函數和變數時,C++的標頭檔需添加extern "C",但是在C語言中不能直接引用聲明了extern "C"的該標頭檔,應該僅將C檔案中將C++中定義的extern "C"函式宣告為extern類型。
筆者編寫的C引用C++函數例子工程中包含的三個檔案的原始碼如下:
//C++標頭檔 cppExample.h
#ifndef CPP_EXAMPLE_H
#define CPP_EXAMPLE_H
extern "C" int add( int x, int y );
#endif
//C++實現檔案 cppExample.cpp
#include "cppExample.h"
int add( int x, int y )
{
return x + y;
}
/* C實現檔案 cFile.c
/* 這樣會編譯出錯:#include "cppExample.h" */
extern int add( int x, int y );
int main( int argc, char* argv[] )
{
add( 2, 3 );
return 0;
}