指標的概念
指標是一個特殊的變數,它裡面儲存的數值被解釋成為記憶體裡的一個地址。要搞清一個指標需要搞清指標的四方面的內容:指標的類型,指標所指向的類型,指標的值或者叫指標所指向的記憶體區,還有指標本身所佔據的記憶體區。讓我們分別說明。
先聲明幾個指標放著做例子:
例一:
int *ptr;
char *ptr;
int **ptr;
int (*ptr)[3];
int *(*ptr)[4];
指標的類型
從文法的角度看,你只要把指標聲明語句裡的指標名字去掉,剩下的部分就是這個指標的類型。這是指標本身所具有的類型。讓我們看看例一中各個指標的類型:
int *ptr; //指標的類型是int *
char *ptr; //指標的類型是char *
int **ptr; //指標的類型是 int **
int (*ptr)[3]; //指標的類型是 int(*)[3]
int *(*ptr)[4]; //指標的類型是 int *(*)[4]
怎麼樣?找出指標的類型的方法是不是很簡單?
指標所指向的類型
當你通過指標來訪問指標所指向的記憶體區時,指標所指向的類型決定了編譯器將把那片記憶體區裡的內容當做什麼來看待。
從文法上看,你只須把指標聲明語句中的指標名字和名字左邊的指標聲明符*去掉,剩下的就是指標所指向的類型。例如:
int *ptr; //指標所指向的類型是int
char *ptr; //指標所指向的的類型是char
int **ptr; //指標所指向的的類型是 int *
int (*ptr)[3]; //指標所指向的的類型是 int()[3]
int *(*ptr)[4]; //指標所指向的的類型是 int *()[4]
在指標的算術運算中,指標所指向的類型有很大的作用。
指標的類型(即指標本身的類型)和指標所指向的類型是兩個概念。當你對C越來越熟悉時,你會發現,把與指標攪和在一起的“類型”這個概念分成“指標的類型”和“指標所指向的類型”兩個概念,是精通指標的關鍵點之一。我看了不少書,發現有些寫得差的書中,就把指標的這兩個概念攪在一起了,所以看起書來前後矛盾,越看越糊塗。
指標的值
指標的值是指標本身儲存的數值,這個值將被編譯器當作一個地址,而不是一個一般的數值。在32位程式裡,所有類型的指標的值都是一個32位整數,因為32位程式裡記憶體位址全都是32位長。
指標所指向的記憶體區就是從指標的值所代表的那個記憶體位址開始,長度為sizeof(指標所指向的類型)的一片記憶體區。以後,我們說一個指標的值是XX,就相當於說該指標指向了以XX為首地址的一片記憶體地區;我們說一個指標指向了某塊記憶體地區,就相當於說該指標的值是這塊記憶體地區的首地址。
指標所指向的記憶體區和指標所指向的類型是兩個完全不同的概念。在例一中,指標所指向的類型已經有了,但由於指標還未初始化,所以它所指向的記憶體區是不存在的,或者說是無意義的。
以後,每遇到一個指標,都應該問問:這個指標的類型是什嗎?指標指向的類型是什嗎?該指標指向了哪裡?
指標本身所佔據的記憶體區
指標本身佔了多大的記憶體?你只要用函數sizeof(指標的類型)測一下就知道了。在32位平台裡,指標本身佔據了4個位元組的長度。
指標本身佔據的記憶體這個概念在判斷一個指標運算式是否是左值時很有用。
指標的算術運算
指標可以加上或減去一個整數。指標的這種運算的意義和通常的數值的加減運算的意義是不一樣的。例如:
例二:
char a[20];
int *ptr=a;
...
...
ptr++;
在上例中,指標ptr的類型是int*,它指向的類型是int,它被初始化為指向整形變數a。接下來的第3句中,指標ptr被加了1,編譯器是這樣處理的:它把指標ptr的值加上了sizeof(int),在32位程式中,是被加上了4。由於地址是用位元組做單位的,故ptr所指向的地址由原來的變數a的地址向高地址方向增加了4個位元組。
由於char類型的長度是一個位元組,所以,原來ptr是指向數組a的第0號單元開始的四個位元組,此時指向了數組a中從第4號單元開始的四個位元組。
我們可以用一個指標和一個迴圈來遍曆一個數組,看例子:
例三:
int array[20];
int *ptr=array;
...
//此處略去為整型數組賦值的代碼。
...
for(i=0;i<20;i++)
{
(*ptr)++;
ptr++;
}
這個例子將整型數組中各個單元的值加1。由於每次迴圈都將指標ptr加1,所以每次迴圈都能訪問數組的下一個單元。再看例子:
例四:
char a[20];
int *ptr = a;
...
...
ptr += 5;
在這個例子中,ptr被加上了5,編譯器是這樣處理的:將指標ptr的值加上5乘sizeof(int),在32位程式中就是加上了5乘4=20。由於地址的單位是位元組,故現在的ptr所指向的地址比起加5後的ptr所指向的地址來說,向高地址方向移動了20個位元組。在這個例子中,沒加5前的ptr指向數組a的第0號單元開始的四個位元組,加5後,ptr已經指向了數組a的合法範圍之外了。雖然這種情況在應用上會出問題,但在文法上卻是可以的。這也體現出了指標的靈活性。
如果上例中,ptr是被減去5,那麼處理過程大同小異,只不過ptr的值是被減去5乘sizeof(int),新的ptr指向的地址將比原來的ptr所指向的地址向低地址方向移動了20個位元組。
總結一下,一個指標ptrold加上一個整數n後,結果是一個新的指標ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型也相同。ptrnew的值將比ptrold的值增加了n乘sizeof(ptrold所指向的類型)個位元組。就是說,ptrnew所指向的記憶體區將比ptrold所指向的記憶體區向高地址方向移動了n乘sizeof(ptrold所指向的類型)個位元組。一個指標ptrold減去一個整數n後,結果是一個新的指標ptrnew,ptrnew的類型和ptrold的類型相同,ptrnew所指向的類型和ptrold所指向的類型也相同。ptrnew的值將比ptrold的值減少了n乘sizeof(ptrold所指向的類型)個位元組,就是說,ptrnew所指向的記憶體區將比ptrold所指向的記憶體區向低地址方向移動了n乘sizeof(ptrold所指向的類型)個位元組。
運算子&和*
這裡&是取地址運算子,*是...書上叫做“間接運算子”。&a的運算結果是一個指標,指標的類型是a的類型加個*,指標所指向的類型是a的類型,指標所指向的地址嘛,那就是a的地址。*p的運算結果就五花八門了。總之*p的結果是p所指向的東西,這個東西有這些特點:它的類型是p指向的類型,它所佔用的地址是p所指向的地址。
例五:
int a=12;
int b;
int *p;
int **ptr;
p=&a;//&a的結果是一個指標,類型是int*,指向的類型是int,指向的地址是a的地址。
*p=24;//*p的結果,在這裡它的類型是int,它所佔用的地址是p所指向的地址,顯然,*p就是變數a。
ptr=&p;//&p的結果是個指標,該指標的類型是p的類型加個*,在這裡是int**。該指標所指向的類型是p的類型,這裡是int*。該指標所指向的地址就是指標p自己的地址。
*ptr=&b;//*ptr是個指標,&b的結果也是個指標,且這兩個指標的類型和所指向的類型是一樣的,所以?amp;b來給*ptr賦值就是毫無問題的了。
**ptr=34;//*ptr的結果是ptr所指向的東西,在這裡是一個指標,對這個指標再做一次*運算,結果就是一個int類型的變數。
指標運算式
一個運算式的最後結果如果是一個指標,那麼這個運算式就叫指標運算式。下面是一些指標運算式的例子:
例六:
int a,b;
int array[10];
int *pa;
pa=&a;//&a是一個指標運算式。
int **ptr=&pa;//&pa也是一個指標運算式。
*ptr=&b;//*ptr和&b都是指標運算式。
pa=array;
pa++;//這也是指標運算式。
例七:
char *arr[20];
char **parr=arr;//如果把arr看作指標的話,arr也是指標運算式
char *str;
str=*parr;//*parr是指標運算式
str=*(parr+1);//*(parr+1)是指標運算式
str=*(parr+2);//*(parr+2)是指標運算式
由於指標運算式的結果是一個指標,所以指標運算式也具有指標所具有的四個要素:指標的類型,指標所指向的類型,指標指向的記憶體區,指標自身佔據的記憶體。
好了,當一個指標運算式的結果指標已經明確地具有了指標自身佔據的記憶體的話,這個指標運算式就是一個左值,否則就不是一個左值。 在例七中,&a不是一個左值,因為它還沒有佔據明確的記憶體。*ptr是一個左值,因為*ptr這個指標已經佔據了記憶體,其實*ptr就是指標pa,既然pa已經在記憶體中有了自己的位置,那麼*ptr當然也有了自己的位置。
數組和指標的關係
如果對聲明數組的語句不太明白的話,請參閱我前段時間貼出的文章<<如何理解c和c++的複雜類型聲明>>。 數組的數組名其實可以看作一個指標。看下例:
例八:
int array[10]={0,1,2,3,4,5,6,7,8,9},value;
...
...
value=array[0];//也可寫成:value=*array;
value=array[3];//也可寫成:value=*(array+3);
value=array[4];//也可寫成:value=*(array+4);
上例中,一般而言數組名array代表數組本身,類型是int [10],但如果把array看做指標的話,它指向數組的第0個單元,類型是int *,所指向的類型是數組單元的類型即int。因此*array等於0就一點也不奇怪了。同理,array+3是一個指向數組第3個單元的指標,所以*(array+3)等於3。其它依此類推。
例九:
char *str[3]={
"Hello,this is a sample!",
"Hi,good morning.",
"Hello world"
};
char s[80];
strcpy(s,str[0]);//也可寫成strcpy(s,*str);
strcpy(s,str[1]);//也可寫成strcpy(s,*(str+1));
strcpy(s,str[2]);//也可寫成strcpy(s,*(str+2));
上例中,str是一個三單元的數組,該數組的每個單元都是一個指標,這些指標各指向一個字串。把指標數組名str當作一個指標的話,它指向數組的第0號單元,它的類型是char**,它指向的類型是char *。
*str也是一個指標,它的類型是char*,它所指向的類型是char,它指向的地址是字串"Hello,this is a sample!"的第一個字元的地址,即'H'的地址。 str+1也是一個指標,它指向數組的第1號單元,它的類型是char**,它指向的類型是char *。
*(str+1)也是一個指標,它的類型是char*,它所指向的類型是char,它指向"Hi,good morning."的第一個字元'H',等等。
下面總結一下數組的數組名的問題。聲明了一個數組TYPE array[n],則數組名稱array就有了兩重含義:第一,它代表整個數組,它的類型是TYPE [n];第二,它是一個指標,該指標的類型是TYPE*,該指標指向的類型是TYPE,也就是數組單元的類型,該指標指向的記憶體區就是數組第0號單元,該指標自己佔有單獨的記憶體區,注意它和數組第0號單元佔據的記憶體區是不同的。該指標的值是不能修改的,即類似array++的運算式是錯誤的。
在不同的運算式中數組名array可以扮演不同的角色。
在運算式sizeof(array)中,數組名array代表數組本身,故這時sizeof函數測出的是整個數組的大小。
在運算式*array中,array扮演的是指標,因此這個運算式的結果就是數組第0號單元的值。sizeof(*array)測出的是數組單元的大小。
運算式array+n(其中n=0,1,2,....。)中,array扮演的是指標,故array+n的結果是一個指標,它的類型是TYPE*,它指向的類型是TYPE,它指向數組第n號單元。故sizeof(array+n)測出的是指標類型的大小。
例十:
int array[10];
int (*ptr)[10];
ptr=&array;
上例中ptr是一個指標,它的類型是int (*)[10],他指向的類型是int [10],我們用整個數組的首地址來初始化它。在語句ptr=&array中,array代表數組本身。
本節中提到了函數sizeof(),那麼我來問一問,sizeof(指標名稱)測出的究竟是指標自身類型的大小呢還是指標所指向的類型的大小?答案是前者。例如:
int (*ptr)[10];
則在32位程式中,有:
sizeof(int(*)[10])==4
sizeof(int [10])==40
sizeof(ptr)==4
實際上,sizeof(對象)測出的都是對象自身的類型的大小,而不是別的什麼類型的大小。
指標和結構類型的關係
可以聲明一個指向結構類型對象的指標。
例十一:
struct MyStruct
{
int a;
int b;
int c;
}
MyStruct ss={20,30,40};//聲明了結構對象ss,並把ss的三個成員初始化為20,30和40。
MyStruct *ptr=&ss;//聲明了一個指向結構對象ss的指標。它的類型是
MyStruct*,它指向的類型是MyStruct。
int *pstr=(int*)&ss;//聲明了一個指向結構對象ss的指標。但是它的類型和它指向的類型和ptr是不同的。
請問怎樣通過指標ptr來訪問ss的三個成員變數?
答案:
ptr->a;
ptr->b;
ptr->c;
又請問怎樣通過指標pstr來訪問ss的三個成員變數?
答案:
*pstr;//訪問了ss的成員a。
*(pstr+1);//訪問了ss的成員b。
*(pstr+2)//訪問了ss的成員c。
呵呵,雖然我在我的MSVC++6.0上調式過上述代碼,但是要知道,這樣使用pstr來訪問結構成員是不正規的,為了說明為什麼不正規,讓我們看看怎樣通過指標來訪問數組的各個單元:
例十二:
int array[3]={35,56,37};
int *pa=array;
通過指標pa訪問數組array的三個單元的方法是:
*pa;//訪問了第0號單元
*(pa+1);//訪問了第1號單元
*(pa+2);//訪問了第2號單元
從格式上看倒是與通過指標訪問結構成員的不正規方法的格式一樣。
所有的C/C++編譯器在排列數組的單元時,總是把各個數組單元存放在連續的儲存區裡,單元和單元之間沒有空隙。但在存放結構對象的各個成員時,在某種編譯環境下,可能會需要字對齊或雙字對齊或者是別的什麼對齊,需要在相鄰兩個成員之間加若干個“填充位元組”,這就導致各個成員之間可能會有若干個位元組的空隙。
所以,在例十二中,即使*pstr訪問到了結構對象ss的第一個成員變數a,也不能保證*(pstr+1)就一定能訪問到結構成員b。因為成員a和成員b之間可能會有若干填充位元組,說不定*(pstr+1)就正好訪問到了這些填充位元組呢。這也證明了指標的靈活性。要是你的目的就是想看看各個結構成員之間到底有沒有填充位元組,嘿,這倒是個不錯的方法。
通過指標訪問結構成員的正確方法應該是象例十二中使用指標ptr的方法。
指標和函數的關係
可以把一個指標聲明成為一個指向函數的指標。
int fun1(char*,int);
int (*pfun1)(char*,int);
pfun1=fun1;
....
....
int a=(*pfun1)("abcdefg",7);//通過函數指標調用函數。
可以把指標作為函數的形參。在函數調用語句中,可以用指標運算式來作為實參。