一.C語言程式的儲存地區
1.由C語言代碼(文字檔)形成可執行程式(二進位檔案),需要經過編譯-彙編-串連三個階段。編譯過程把C語言文字檔產生組譯工具,彙編過程把組譯工具形成二進位機器代碼,串連過程則將各個源檔案產生的二進位機器代碼檔案組合成一個檔案。
2.C語言編寫的程式經過編譯-串連後,將形成一個統一檔案,它由幾個部分組成。在程式運行時又會產生其他幾個部分,各個部分代表了不同的儲存地區:
1>程式碼片段(Code或Text)
程式碼片段由程式中執行的機器程式碼群組成。在C語言中,程式語句執行編譯後,形成機器代碼。在執行程式的過程中,CPU的程式計數器指向程式碼片段的每一條機器代碼,並由處理器依次運行。
2>唯讀資料區段(RO data)
唯讀資料區段是程式使用的一些不會被更改的資料,使用這些資料的方式類似查表式的操作,由於這些變數不需要更改,因此只需要放置在唯讀記憶體中即可。
3>已初始化讀寫資料區段(RW data)
已初始化資料是在程式中聲明,並且具有初值的變數,這些變數需要佔用儲存空間的空間,在程式執行時它們需要位於可讀寫的記憶體地區內,並且有初值,以供程式運行時讀寫。
4>未初始化資料區段(BBS)
未初始化資料是在程式中聲明,但是沒有初始化的變數,這些變數在程式運行之前不需要佔用儲存空間的空間。
5>堆(heap)
堆記憶體只在程式運行時出現,一般由程式員分配和釋放。在具有作業系統的情況下,如果程式沒有釋放,作業系統可能在程式(例如一個進程)結束後會後記憶體。
6>棧(statck)
堆記憶體只在程式運行時出現,在函數內部使用的變數,函數的參數以及傳回值將使用棧空間,棧空間由編譯器自動分配和釋放。
3.程式碼片段、唯讀資料區段、讀寫資料區段、未初始化資料區段屬於靜態地區,而堆和棧屬於動地區。程式碼片段、唯讀資料區段和讀寫資料區段將在串連之後產生,未初始化資料區段將在程式初始化的時候開闢,而對堆和棧將在程式餓運行中分配和釋放。
4.C語言程式分為映像和運行時兩種狀態。在編譯-串連後形成的映像中,將只包含程式碼片段(Text)、唯讀資料區段(R0 Data)和讀寫資料區段(RW Data)。在程式運行之前,將動態產生未初始化資料區段(BSS),在程式的運行時還將動態產生堆(Heap)地區和棧(Stack)地區。
註:1.一般來說,在靜態映像檔案中,各個部分稱之為節(Section),而在運行時的各個部分稱之為段(Segment)。如果不詳細區分,統稱為段。
2.C語言在編譯串連後,將產生程式碼片段(TEXT),唯讀資料區段(RO Data)和讀寫資料區段(RW Data)。在運行時,除了上述三個地區外,還包括未初始化資料區段(BBS)地區和堆(heap)地區和棧(Stack)地區。
二.C語言程式的段
1.段的分類
每一個來源程式產生的目標代碼將包含來源程式所需要表達的所有資訊和功能。目標代碼中各段產生情況如下:
1>程式碼片段(Code)
程式碼片段由程式中的各個函數產生,函數的每一個語句將最終經過編譯和彙編產生二進位機器代碼
2>唯讀資料區段(RO Data)
唯讀資料區段由程式中所使用的資料產生,該部分資料的特點在運行中不需要改變,因此編譯器會將資料放入唯讀部分中。C語言的一些文法將產生唯讀資料資料區段。
² 唯讀資料區段(RO Data)
唯讀資料區段(RO Data)由程式中所使用的資料產生,該部分資料的特點是在運行中不需要改變,因此編譯器會將資料放入唯讀部分中。以下情況將產生唯讀資料區段。
n 唯讀全域變數
定義全域變數const char a[100]=”abcdefg”將產生大小為100個位元組的唯讀資料區,並使用字串“abcdefg”初始化。如果定義為const char a[]=”abcdefg”,沒有指定大小,將根據“abcdefgh”字串的長度,產生8個位元組的唯讀資料區段。
n 唯讀局部變數
例如:在函數內部定義的變數const char b[100]=”9876543210”;其初始化的過程和全域變數。
n 程式中使用的常量
例如:在程式中使用printf("information\n”),其中包含了字串常量,編譯器會自動把常量“information \n”放入唯讀資料區。
註:在const char a[100]={“ABCDEFG”}中,定義了100個位元組的資料區,但是只初始化了前面的8個位元組(7個字元和表示結束符的‘\0’)。在這種用法中,實際後面的位元組米有初始化,但是在程式中也不能寫,實際上沒有任何用處。因此,在唯讀資料區段中,一般都需要做完全的的初始化。
3.讀寫資料區段(RW Data)
讀寫資料區段表示了在目標檔案中一部分可以讀也可以寫的資料區,在某些場合它們又被稱為已初始化資料區段。這部分資料區段和代碼,與唯讀資料區段一樣都屬於程式中的靜態地區,但是具有科協的特點。
n 已初始化全域變數
例如:在函數外部,定義全域的變數char a[100]=”abcdefg”
n 已初始化局部靜態變數
例如:在函數中定義static char b[100]=”9876543210”。函數中由static定義並且已經初始化的資料和數組將被編譯為讀寫資料區段。
說明:
讀寫資料區的特點是必須在程式中經過初始化,如果只有定義,沒有初始值,則不會產生讀寫資料區,而會定義為未初始化資料區(BSS)。如果全域變數(函數外部定義的變數)加入static修飾符,寫成static char a[100]的形式,這表示只能在檔案內部使用,而不能被其他檔案使用。
4.未初始化資料區段(BSS)
未初始化資料區段常被稱之為BSS(英文名為Block start by symbol的縮寫)。與讀寫資料區段類似,它也屬於待用資料區。但是該段中資料沒有經過初始化。因此它只會在目標檔案中被標識,而不會真正稱為目標檔案中的一個段,該段將會在運行時產生。未初始化資料區段只有在啟動並執行初始化階段才會產生,因此它的大小不會影響目標檔案的大小。
三.在C語言的程式中,對變數的使用還有以下注意
1.在函數體中定義的變數通常是在棧上,不需要在程式中進行管理,由編譯器處理。
2.用malloc,calloc,realoc等分配分配記憶體的函數所分配的記憶體空間在堆上,程式必須保證在使用後使用後freee釋放,否則會發生記憶體流失。
3.所有函數體外定義的是全域變數,加了static修飾符後的變數不管在函數內部或者外部存放在全域區(靜態區)。
4.使用const定義的變數將放於程式的唯讀資料區。
說明:
在C語言中,可以定義static變數:在函數體內定義的static變數只能在該函數體內有效;在所有函數體外定義的static變數,也只能在該檔案中有效,不能在其他源檔案中使用;對於沒有使用static修飾的全域變數,可以在其他的源檔案中使用。這些區別是編譯的概念,即如果不按要求使用變數,編譯器會報錯。使用static 和沒使用static修飾的全域變數最終都將放置在程式的全域去(靜態去)。
四.程式中段的使用
C語言中的全域區(靜態區),實際上對應著下述幾個段:
唯讀資料區段:R0 Data
讀寫資料區段:RW Data
未初始化資料區段:BSS Data
一般來說,直接定義的全域變數在未初始化資料區,如果該變數有初始化則是在已初始化資料區(RW Data),加上const修飾符將放置在唯讀地區(R0 Data).
eg:
const char ro[]=”this is a readonlydata”;//唯讀資料區段,不能改變ro數組中的內容,ro存放在唯讀資料區段。
char rw1[]=”this is global readwrite data”;//已初始化讀寫資料區段,可以改變數組rw1中的內容。應為數值是賦值不是把”this is global readwrite data” 地址給了rw1,不能改變”this is global readwrite data”的數值。因為起是文字常量放在唯讀資料區段中
char bss_1[100];//未初始化資料區段
const char *ptrconst = “constant data”;//”constant data”放在唯讀資料區段,不能改變ptrconst中的值,因為其是地址賦值。ptrconst指向存放“constant data”的地址,其為唯讀資料區段。但可以改變ptrconst地址的數值,因其存放在讀寫資料區段中。
int main()
{
short b;//b放置在棧上,佔用2個位元組
char a[100];//需要在棧上開闢100個位元組,a的值是其首地址
chars[]=”abcde”;//s在棧上,佔用4個位元組,“abcde”本身放置在唯讀資料存放區區,佔6位元組。s是一個地址常量,不能改變其地址數值,即s++是錯誤的。
char*p1;//p1在棧上,佔用4個位元組
char*p2 =”123456”;//”123456”放置在唯讀資料存放區區,佔7個位元組。p2在棧上,p2指向的內容不能更改,但是p2的地址值可以改變,即p2++是對的。
static char bss_2[100];//局部未初始化資料區段
static int c=0 ;//局部(靜態)初始化區
p1 = (char *)malloc(10*sizeof(char));//分配的記憶體地區在堆區
strcpy(p1,”xxx”);//”xxx”放置在唯讀資料存放區區,佔5個位元組
free(p1);//使用free釋放p1所指向的記憶體
return 0;
}
說明:
1.唯讀資料區段需要包括程式中定義的const型的資料(如:const char ro[]),還包括程式中需要使用的資料如“123456”。對於const char ro[]和const char * ptrconst的定義,它們指向的記憶體都位於唯讀資料據區,其指向的內容都不允許修改。區別在於前者不允許在程式中修改ro的值,後者允許在程式中修改ptrconst本身的值。對於後者,改寫成以下的形式,將不允許在程式中修改ptrconst本身的值:
const char * const ptrconst = “const data”;
2.讀寫資料區段包含了已經初始化的全域變數static char rw1[]以及局部靜態變數static char
rw2[]。rw1和rw2的差別在於編譯時間,是在函數內部使用的還是可以在整個檔案中使用。對於前者,static修飾在於控製程序的其他檔案時候可以訪問rw1變數,如果有static修飾,將不能在其他的C語言源檔案中使用rw1,這種影響針對編譯-串連的特性,但無論有static,變數rw1都將被放置在讀寫資料區段。對於後者rw2,它是局部的靜態變數,放置在讀寫資料區;如果不使用static修飾,其意義將完全改變,它將會是開闢在棧空間局部變數,而不是靜態變數。
3.未初始化資料區段,案例1中的bss_1[100]和bss_2[200]在程式中代表未初始化的資料區段。其區別在於前者是全域的變數,在所有檔案中都可以使用;後者是局部的變數,只在函數內部使用。未初始化資料區段不設定後面的初始化數值,因此必須使用數值指定地區的大小,
編譯器將根據大小設定BBS中需要增加的長度。
4.棧空間包括函數中內部使用的變數如short b和char a[100],以及char *p1中p1這個變數的值。
1》變數p1指向的記憶體建立在堆空間上,堆空間只能在程式內部使用,但是堆空間(例如p1指向的記憶體)可以作為傳回值傳遞給其他函數處理。
2》棧空間主要用於以下3類資料的儲存:
a.函數內部的動態變數
b.函數的參數
c.函數的傳回值
3》棧空間主要的用處是供函數內部的動態變數使用,變數的空間在函數開始之前開闢,在函數退出後由編譯器自動回收
4.看一個案例:
#include<stdio.h>
int main()
{
char*p =”tiger”;
p[1]=’I’;
p++;
printf(“%s\n”,p);
}
編譯後提示:段錯誤
分析:
char *p =”tiger”;系統在棧上開闢了4個位元組儲存p的數值。”tiger”在唯讀儲存區中儲存,因此”tiger”的內容不能改變,*p=”tiger”,表示地址賦值,因此,p指向了唯讀儲存區,因此改變p指向的內容會引起段錯誤。但是因為p是存放在棧上,因此p的數值是可以改變的,因此p++是正確的。
五.const的使用
1.前言:
const是一個C語言的關鍵字,它限定一個變數不允許被改變。使用const在一定程式上可以提高程式的健壯性,另外,在觀看別人代碼的時候,清晰理解const所起的作用,對理解被人的程式有所協助。
2.const變數和 常量
(1)const修飾的變數,其值存放在唯讀資料區段中,起值不能被改變。稱為唯讀變數。
其形式為 const int a=5;此處可以用a代替5.
(2)常量:其也存在唯讀資料區段中,其數值也不能被改變。其形式為”abc”,5.
3.const 變數和const限定的內容
先看一個案例:
#include<stdio.h>
typedef char *pStr;
intmain()
{
char string[6] = “tiger”;
const char*p1 = string;
const pStr p2 = string;
p1++;
p2++;
printf(“p1=%s\np2=%s\n”,p1,p2);
}
程式經過編譯後,提示錯誤為
error:increment of read-only variable ‘p2’
1>const 使用的基本形式為:const char m;
限定m 不可變
2>替換1式中的m,const char *pm;
限定*pm不可變,當然pm是可變的,因此p1++是對的。
3>替換1式中的char,const newType m;
限定m不可變,問題中的pStr是一種新類型,因此問題中p2不可變,p2++是錯誤的。
(3)const 和指標
型別宣告中const用來修飾一個常量,有如下兩種寫法:
1>const在前面
const int nValue;//nValue是const
const char *pContent;//*pContent是const,pConst可變
const (char *)pContent;//pContent是const,*pContent可變
char *const pContent;//pContent是const,*pContent可變
const char * const pContent;//pContent和*pContent都是const
2>const 在後面與上面的聲明對等
int const nValue; // nValue是const
char const * pContent;//*pContent是const, pContent可變
(char *) constpContent;//pContent是const, *pContent可變
char* const pContent;// pContent是const, *pContent可變
char const* const pContent;//pContent和*pContent都是const
說明:const和指標一起使用是C語言中一個很常見的困惑之處,下面是兩天規則:
(1)沿著*號劃一條線,如果const位於*的左側,則const就是用來修飾指標所指向的變數,即指標指向為常量;如果const位於*的右側,const就是修飾指標本身,即指標本身是常量。你可以根據這個規則來看上面聲明的實際意義,相信定會一目瞭然。
(2)對於const (char *) ; 因為char *是一個整體,相當於一個類型(如char),因此,這是限定指標是const。