堆(heap)和棧(stack)是C/C++編程不可避免會碰到的兩個基本概念。首先,這兩個概念都可以在講資料
結構的書中找到,他們都是基本的資料結構,雖然棧更為簡單一些。
在具體的C/C++編程架構中,這兩個概念並不是並行的。對底層機器代碼的研究可以揭示,棧是機器系
統提供的資料結構,而堆則是C/C++函數庫提供的。
具體地說,現代電腦(串列執行機制),都直接在代碼底層支援棧的資料結構。這體現在,有專門的寄
存器指向棧所在的地址,有專門的機器指令完成資料入棧出棧的操作。
這種機制的特點是效率高,支援的資料有限,一般是整數,指標,浮點數等系統直接支援的資料類型,
並不直接支援其他的資料結構。因為棧的這種特點,對棧的使用在程式中是非常頻繁的。對子程式的調
用就是直接利用棧完成的。機器的call指令裡隱含了把返回地址推入棧,然後跳轉至子程式地址的操
作,而子程式中的ret指令則隱含從堆棧中彈出返回地址並跳轉之的操作。C/C++中的自動變數是直接利
用棧的例子,這也就是為什麼當函數返回時,該函數的自動變數自動失效的原因。
和棧不同,堆的資料結構並不是由系統(無論是機器系統還是作業系統)支援的,而是由函數庫提供的。
基本的malloc/realloc/free函數維護了一套內部的堆資料結構。當程式使用這些函數去獲得新的記憶體
空間時,這套函數首先試圖從內部堆中尋找可用的記憶體空間,如果沒有可以使用的記憶體空間,則試圖利
用系統調用來動態增加程式資料區段的記憶體大小,新分配得到的空間首先被組織進內部堆中去,然後再以
適當的形式返回給調用者。當程式釋放分配的記憶體空間時,這片記憶體空間被返回內部堆結構中,可能會
被適當的處理(比如和其他空閑空間合并成更大的空閑空間),以更適合下一次記憶體配置申請。這套複雜
的分配機制實際上相當於一個記憶體配置的緩衝池(Cache),使用這套機制有如下若干原因:
1. 系統調用可能不支援任意大小的記憶體配置。有些系統的系統調用只支援固定大小及其倍數的記憶體請
求(按頁分配);這樣的話對於大量的小記憶體分類來說會造成浪費。
2. 系統調用申請記憶體可能是代價昂貴的。系統調用可能涉及使用者態和核心態的轉換。
3. 沒有管理的記憶體配置在大量複雜記憶體的分配釋放操作下很容易造成記憶體片段。
堆和棧的對比
從以上知識可知,棧是系統提供的功能,特點是快速高效,缺點是有限制,資料不靈活;而堆是函數庫
提供的功能,特點是靈活方便,資料適應面廣泛,但是效率有一定降低。棧是系統資料結構,對於進
程/線程是唯一的;堆是函數庫內部資料結構,不一定唯一。不同堆分配的記憶體無法互相操作。棧空間
分靜態分配和動態分配兩種。靜態分配是編譯器完成的,比如自動變數(auto)的分配。動態分配由
alloca函數完成。棧的動態分配無需釋放(是自動的),也就沒有釋放函數。為可移植的程式起見,棧的
動態分配操作是不被鼓勵的!堆空間的分配總是動態,雖然程式結束時所有的資料空間都會被釋放回
系統,但是精確的申請記憶體/釋放記憶體匹配是良好程式的基本要素。