C語言程式的記憶體布局
一:C語言程式的儲存地區
C語言編寫的程式經過編繹-連結後,將形成一個統一的檔案,它由幾個部分組成,在程式運行時又會產生幾個其他部分,各個部分代表了不同的儲存地區:
1.程式碼片段(Code or Text):
程式碼片段由程式中的機器碼組成。在C語言中,程式語句進行編譯後,形成機器代碼。在執行程式的過程中,CPU的程式計數器指向程式碼片段的每一條代碼,並由處理器依次運行。
2.唯讀資料區段(RO data):
唯讀資料區段是程式使用的一些不會被更改的資料,使用這些數方式類似查表式的操作,由於這些變數不需要更改,因此只需要放置在唯讀記憶體中即可。
3.已初始化讀寫資料區段(RW data):
已初始化資料是在程式中聲明,並且具有初值的變數,這些變數需要佔用儲存空間的空間,在程式執行時它們需要位於可讀寫的記憶體地區內,並具有初值,以供程式運行時讀寫。
4.未初始化讀寫資料區段(BSS):
未初始化讀寫據是在程式中聲明,但是沒有初始化的變數,這些變數在程式運行之前不需要佔用儲存空間的空間。
5.堆(heap):
堆記憶體只在程式運行時出現,一般由程式員分配和釋放。在具有作業系統的情況下,如果程式員沒釋放,作業系統可以在程式結束後回收記憶體。
6.棧(stack):
棧記憶體只在程式運行時出現,在函數內部使用的變數,函數的參數以及傳回值將使用棧空間,棧空間由編譯器自動分配和釋放。
C語言目標檔案的記憶體布局
程式碼片段,唯讀資料區段,讀寫資料區段,未初始化資料區段屬於靜態地區,而堆和棧屬於動態地區。程式碼片段,唯讀資料區段和讀寫資料區段將在串連之後產生,未初始化資料區段將在程式初始化的時候開闢,而堆和棧將在程式的運行中分配和釋放。
C語言程式分為映像和運行時兩種狀態,在編譯串連後形成的映像中,將只包含程式碼片段,唯讀資料區段和讀寫資料區段,在程式運行之前,將動態產生未初始化資料區段,在程式運行時還將動態形成堆地區和棧地區。
一般來說,在靜態映像檔案中,各個部分稱之為節(Section),而在運行時的各個部分稱之為段(Segment),有時統稱為段。
二:C語言程式的段
1.程式碼片段(code)
程式碼片段由各個函數產生,函數的每一個語句將最終經過編繹和彙編產生二進位機器代碼(具體生生哪種體繫結構的機器代碼由編譯器決定)。
2.唯讀資料區段(RO Data)
唯讀資料區段由程式中所使用的資料產生,該部分資料的特點是在運行中不需要改變,因此編譯器會將該資料區段放入唯讀部分中。C語言中的唯讀全域變數,唯讀局部變數,程式中使用的常量等會在編譯時間被放入到唯讀資料區。注意:
定義全域變數const char a[100]={"ABCDEFG"};將產生大小為100個位元組的唯讀資料區,並使用“ABCDEFG”初始化。如果定義為:const char a[ ]={"ABCDEFG"};則根據字串長度產生8個位元組的唯讀資料區段(還有’\0’),所以在唯讀資料區段中,一般都需要做完全的初始化。
3. 讀寫資料區段(RW Data)
讀寫資料區段表示了在目標檔案中一部分可以讀也可以寫的資料區,在某些場合它們又被稱為已初始化資料區段,這部分資料區段和程式碼片段,與唯讀資料區段一樣都屬於程式中的靜態地區,但具有可寫性的特點。通常已初始化的全域變數和局部靜態變數被放在了讀寫資料區段,如: 在函數中定義static char b[ 100]={“ABCDEFG”};讀寫資料區的特點是必須在程式經過初始化,如果只定義,沒初始值,則不會產生讀寫資料區,而會定位為未初始化資料區(BSS)。
如果全域變數(函數外部定義的變數)加入static修飾,這表示只能在檔案內使用,而不能被其他檔案使用。
4. 未初始化資料區段(BSS)
與讀寫資料區段類似,它也屬於待用資料區,但是該段中的資料沒有經過初始化。因此它只會在目標檔案中被標識,而不會真正稱為目標檔案中的一段,該段將會在運行時產生。未初始化資料區段只在啟動並執行初始化階段才會產生,因此它的大小不會影響目標檔案的大小。
在C語言的程式中,對變數的使用還有以下幾點需要注意:
1. 函數體中定義的變數通常是在棧上,不需要在程式中進行管理,由編繹器處理。
2. 用malloc,calloc,realloc等分配記憶體的函數所分配的記憶體空間在堆上,程式必須保證在使用free釋放,否則會發生記憶體流失。
3. 所有函數體外定義的是全域變數,加了static後的變數不管是在函數內部或外部都放在全域區。
4. 使用const定義的變數將放於程式的唯讀資料區。
三:程式中段的使用
下面用一個簡單的例子來說明C語言中變數和段的對應關係。C語言程式中的全域區(靜態區),實際對應著下述幾個段:RO Data; RW Data ; BSS Data.
一般來說,直接定義的全域變數在未初始化資料區,如果該變數有初始化則是在已初始化資料區(RW Data),加上const則將放在唯讀資料區。
例:const char ro[ ] = {"this is read only data"}; / /唯讀資料區
static char rw_1[ ] ={"this is global read write data"}; //已初始化讀寫資料區段
char BSS_1[ 100]; //未初始化資料區段
const char *ptrconst ="constant data"; //字串放在唯讀取資料區段
int main()
{
short b; //在棧上,佔用2個位元組
char a[100]; //在棧上開闢100個位元組,工的值是其首地址
char s[ ]="abcdefg"; //s在棧上,佔用4個位元組
//“abcdefg”本身放置在唯讀資料存放區區,佔8個位元組
char *p1; //p1在棧上,佔用4個位元組
char *p2="123456"; //p2 在棧上,p2指向的內容不能改,
//“123456”在唯讀資料區
static char rw_2[ ]={"this is local read write data"};//局部已初始化讀寫資料區段
static char BSS_2[100]; //局部未初始化資料區段
static int c = 0; //全域(靜態)初始化區
p1=(char *)malloc(10 * sizeof(char ) ); //分配記憶體地區在堆區
strcpy(p1,"xxxx"); //“XXXX”放在唯讀資料區,佔5個位元組
free(p1); //使用free釋放p1所指向的記憶體
return 0;
}
讀寫資料區段包含了憶初始化的全域變數 static char rw_1[ ]以及局部靜態變數static rw_2[ ].其差別在於編繹時,是在函人部使用的還是可以在整個檔案中使用。對於rw_1[] 無論有無static 修飾,其都將被放置在讀寫資料區,只是能否被其它檔案引用與否。對於後者就不一樣了,它是局部靜態變數,放置在讀寫資料區,如果沒static修飾,其意義完全改變,它將會是開闢在棧空間的局部變數,而不是靜態變數,在這裡rw_1[],rw_2[]後沒具體數值,表示靜態區大小同後面字串長度決定。
對於未初始化資料區BSS_1[100]與BSS_2[100],其區別在於前者是全域變數,在所有檔案中都可以使用;後者是局部變數,只在函數內部使用。未初始化資料區段不設定後面的初始化數值,因此必須使用數值指定地區的大小,編繹器將根據大小設定BSS中需要增加的長度。
棧空間主要用於以下3資料的儲存:
1. 函數內部的動態變數
2. 函數的參數
3. 函數的傳回值
棧空間是動態開闢與回收的。在函數調用過程中,如果函數調用的層次比較多,所需要的棧空間也逐漸加大,對於參數的傳遞和傳回值,如果使用較大的結構體,在使用的棧空間也會比較大。