標籤:
1. Java中堆棧(stack)和堆(heap)
(1)記憶體配置的策略
按照編譯原理的觀點,程式運行時的記憶體配置有三種策略,分別是靜態,棧式的,和堆式的.
靜態儲存分配是指在編譯時間就能確定每個資料目標在運行時刻的儲存空間需求,因而在編譯時間就可以給他們分配固定的記憶體空間.這種分配策略要求程式碼中不 允許有可變資料結構(比如可變數組)的存在,也不允許有嵌套或者遞迴的結構出現,因為它們都會導致編譯器無法計算準確的儲存空間需求.
棧式儲存分配也可稱為動態儲存裝置分配,是由一個類似於堆棧的運行棧來實現的.和靜態儲存分配相反,在棧式儲存方案中,程式對資料區的需求在編譯時間是完全未 知的,只有到啟動並執行時候才能夠知道,但是規定在運行中進入一個程式模組時,必須知道該程式模組所需的資料區大小才能夠為其分配記憶體.和我們在資料結構所熟 知的棧一樣,棧式儲存分配按照先進後出的原則進行分配。
靜態儲存分配要求在編譯時間能知道所有變數的儲存要求,棧式儲存分配要求在過程的入口處必須知道所有的儲存要求,而堆式儲存分配則專門負責在編譯時間或運行 時模組入口處都無法確定儲存要求的資料結構的記憶體配置,比如可變長度串和對象執行個體.堆由大片的可利用塊或空閑塊組成,堆中的記憶體可以按照任意順序分配和釋 放.
(2)堆和棧的比較
上面的定義從編譯原理的教材中總結而來,除靜態儲存分配之外,都顯得很呆板和難以理解,下面撇開靜態儲存分配,集中比較堆和棧:
從堆和棧的功能和作用來通俗的比較,堆主要用來存放對象的,棧主要是用來執行程式的.而這種不同又主要是由於堆和棧的特點決定的:
在編程中,例如C/C++中,所有的方法調用都是通過棧來進行的,所有的局部變數,形式參數都是從棧中分配記憶體空間的。實際上也不是什麼分配,只是從棧 頂向上用就行,就好像工廠中的傳送帶(conveyor belt)一樣,Stack Pointer會自動指引你到放東西的位置,你所要做的只是把東西放下來就行.退出函數的時候,修改棧指標就可以把棧中的內容銷毀.這樣的模式速度最快, 當然要用來運行程式了.需要注意的是,在分配的時候,比如為一個即將要調用的程式模組分配資料區時,應事Crowdsourced Security Testing道這個資料區的大小,也就說是雖然分配是在程 序運行時進行的,但是分配的大小多少是確定的,不變的,而這個"大小多少"是在編譯時間確定的,不是在運行時.
堆是應用程式在啟動並執行時候請求作業系統分配給自己記憶體,由於從作業系統管理的記憶體配置,所以在分配和銷毀時都要佔用時間,因此用堆的效率非常低.但是堆的 優點在於,編譯器不必知道要從堆裡分配多少儲存空間,也不必知道儲存的資料要在堆裡停留多長的時間,因此,用堆儲存資料時會得到更大的靈活性。事實上,面 向對象的多態性,堆記憶體配置是必不可少的,因為多態變數所需的儲存空間只有在運行時建立了對象之後才能確定.在C++中,要求建立一個對象時,只需用 new命令編製相關的代碼即可。執行這些代碼時,會在堆裡自動進行資料的儲存.當然,為達到這種靈活性,必然會付出一定的代價:在堆裡分配儲存空間時會花 掉更長的時間!這也正是導致我們剛才所說的效率低的原因,看來列寧同志說的好,人的優點往往也是人的缺點,人的缺點往往也是人的優點(暈~).
(3)JVM中的堆和棧
JVM是基於堆棧的虛擬機器.JVM為每個新建立的線程都分配一個堆棧.也就是說,對於一個Java程式來說,它的運行就是通過對堆棧的操作來完成的。堆棧以幀為單位儲存線程的狀態。JVM對堆棧只進行兩種操作:以幀為單位的壓棧和出棧操作。
我們知道,某個線程正在執行的方法稱為此線程的當前方法.我們可能不知道,當前方法使用的幀稱為當前幀。當線程啟用一個Java方法,JVM就會線上程的 Java堆棧裡新壓入一個幀。這個幀自然成為了當前幀.在此方法執行期間,這個幀將用來儲存參數,局部變數,中間計算過程和其他資料.這個幀在這裡和編譯 原理中的活動紀錄的概念是差不多的.
從Java的這種分配機制來看,堆棧又可以這樣理解:堆棧(Stack)是作業系統在建立某個進程時或者線程(在支援多線程的作業系統中是線程)為這個線程建立的儲存地區,該地區具有先進後出的特性。
每一個Java應用都唯一對應一個JVM執行個體,每一個執行個體唯一對應一個堆。應用程式在運行中所建立的所有類執行個體或數組都放在這個堆中,並由應用所有的線程 共用.跟C/C++不同,Java中分配堆記憶體是自動初始化的。Java中所有對象的儲存空間都是在堆中分配的,但是這個對象的引用卻是在堆棧中分配,也 就是說在建立一個對象時從兩個地方都分配記憶體,在堆中分配的記憶體實際建立這個對象,而在堆棧中分配的記憶體只是一個指向這個堆對象的指標(引用)而已。
2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的寄存器。但缺點是,存在棧中的資料大小與生存期必須是確定的,缺乏靈活性。另外,棧資料可以共用,詳見第3點。堆的優勢是可以動態地分配記憶體大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由於要在運行時動態分配記憶體,存取速度較慢。
3. Java中的資料類型有兩種。
一種是基本類型(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本類型)。這種類型的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變數。值得注意的是,自動變數存的是字面值,不是類的執行個體,即不是類的引用,這裡並沒有類的存在。如int a = 3; 這裡的a是一個指向int類型的引用,指向3這個字面值。這些字面值的資料,由於大小可知,生存期可知(這些字面值固定定義在某個程式塊裡面,程式塊退出後,欄位值就消失了),出於追求速度的原因,就存在於棧中。
另外,棧有一個很重要的特殊性,就是存在棧中的資料可以共用。假設我們同時定義:
複製內容到剪貼簿代碼:
int a = 3;
int b = 3;
編譯器先處理int a = 3;首先它會在棧中建立一個變數為a的引用,然後尋找有沒有字面值為3的地址,沒找到,就開闢一個存放3這個字面值的地址,然後將a指向3的地址。接著處理int b = 3;在建立完b的引用變數後,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。
特別注意的是,這種字面值的引用與類對象的引用不同。假定兩個類對象的引用同時指向一個對象,如果一個對象引用變數修改了這個對象的內部狀態,那麼另一個對象引用變數也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例,我們定義完a與b的值後,再令a=4;那麼,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜尋棧中是否有4的字面值,如果沒有,重新開闢地址存放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。
另一種是封裝類資料,如Integer, String, Double等將相應的基礎資料型別 (Elementary Data Type)封裝起來的類。這些類資料全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在運行時才根據需要動態建立,因此比較靈活,但缺點是要佔用更多的時間。 4. String是一個特殊的封裝類資料。即可以用String str = new String("abc");的形式來建立,也可以用String str = "abc";的形式來建立(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的運算式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種運算式是可以的!因為編譯器在後台進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程,即在Java中,一切都是對象,而對象是類的執行個體,全部通過new()的形式來建立。Java中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新建立的類,似乎違反了此原則。其實不然。該類運用了單例模式來返回類的執行個體,只不過這個執行個體是在該類內部通過new()來建立的,而getInstance()向外部隱藏了此細節。那為什麼在String str = "abc";中,並沒有通過new()來建立執行個體,是不是違反了上述原則?其實沒有。
5. 關於String str = "abc"的內部工作。Java內部將此語句轉化為以下幾個步驟:
(1)先定義一個名為str的對String類的對象引用變數:String str;
(2)在棧中尋找有沒有存放值為"abc"的地址,如果沒有,則開闢一個存放字面值為"abc"的地址,接著建立一個新的String類的對象o,並將o的字串值指向這個地址,而且在棧中這個地址旁邊記下這個引用的對象o。如果已經有了值為"abc"的地址,則尋找對象o,並返回o的地址。
(3)將str指向對象o的地址。
值得注意的是,一般String類中字串值都是直接存值的。但像String str = "abc";這種場合下,其字串值卻是儲存了一個指向存在棧中資料的引用!
為了更好地說明這個問題,我們可以通過以下的幾個代碼進行驗證。
複製內容到剪貼簿代碼:
String str2 = "abc"; System.out.println(str1==str2); //true
注意,我們這裡並不用str1.equals(str2);的方式,因為這將比較兩個字串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個對象時才返回真值。而我們在這裡要看的是,str1與str2是否都指向了同一個對象。
結果說明,JVM建立了兩個引用str1和str2,但只建立了一個對象,而且兩個引用都指向了這個對象。
我們再來更進一步,將以上代碼改成:
複製內容到剪貼簿代碼:
String str2 = "abc"; str1 = "bcd"; System.out.println(str1 + "," + str2); //bcd, abc System.out.println(str1==str2); //false
建立了兩個引用。建立了兩個對象。兩個引用分別指向不同的兩個對象。
以上兩段代碼說明,只要是用new()來建立對象的,都會在堆中建立,而且其字串是單獨存值的,即使與棧中的資料相同,也不會與棧中的資料共用。
6. 資料類型封裝類的值不可修改。不僅僅是String類的值不可修改,所有的資料類型封裝類都不能更改其內部的值。 7. 結論與建議:
(1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們建立了String類的對象str。擔心陷阱!對象可能並沒有被建立!唯一可以肯定的是,指向String類的引用被建立了。至於這個引用到底是否指向了一個新的對象,必鬚根據上下文來考慮,除非你通過new()方法來顯要地建立一個新的對象。因此,更為準確的說法是,我們建立了一個指向String類的對象的引用變數str,這個對象引用變數指向了某個值為"abc"的String類。清醒地認識到這一點對排除程式中難以發現的bug是很有協助的。
(2)使用String str = "abc";的方式,可以在一定程度上提高程式的運行速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新對象。而對於String str = new String("abc");的代碼,則一概在堆中建立新對象,而不管其字串值是否相等,是否有必要建立新對象,從而加重了程式的負擔。這個思想應該是享元模式的思想,但JDK的內部在這裡實現是否應用了這個模式,不得而知。
(3)當比較封裝類裡面的數值是否相等時,用equals()方法;當測試兩個封裝類的引用是否指向同一個對象時,用==。
(4)由於String類的immutable性質,當String變數需要經常變換其值時,應該考慮使用StringBuffer類,以提高程式效率。
原文:http://blog.csdn.net/shimiso
Java堆棧詳解