文章目錄
- 序列化機制:
- 處理物件流程:
- 定製序列化過程:
- 完全定製序列化過程:
目前網路上關於對象序列化的文章不少,但是我發現詳細敘述用法和原理的文章太少。本人把自己經過經驗總結和實際運用中的體會寫成的學習筆記貢獻給大家。希望能為整個java社區的繁榮做一點事情。
序列化的過程就是對象寫入位元組流和從位元組流中讀取對象。將對象狀態轉換成位元組流之後,可以用java.io包中的各種位元組流類將其儲存到檔案中,管道到另一線程中或通過網路連接將對象資料發送到另一主機。對象序列化功能非常簡單、強大,在RMI、Socket、JMS、EJB都有應用。對象序列化問題在網路編程中並不是最激動人心的課題,但卻相當重要,具有許多實用意義。
一:對象序列化可以實現分布式對象。主要應用例如:RMI要利用對象序列化運行遠程主機上的服務,就像在本地機上運行對象時一樣。
二:java對象序列化不僅保留一個對象的資料,而且遞迴儲存對象引用的每個對象的資料。可以將整個對象層次寫入位元組流中,可以儲存在檔案中或在網路連接上傳遞。利用對象序列化可以進行對象的“深複製”,即複製對象本身及引用的對象本身。序列化一個對象可能得到整個對象序列。
從上面的敘述中,我們知道了對象序列化是java編程中的必備武器,那麼讓我們從基礎開始,好好學習一下它的機制和用法。
java序列化比較簡單,通常不需要編寫儲存和恢複對象狀態的定製代碼。實現java.io.Serializable介面的類對象可以轉換成位元組流或從位元組流恢複,不需要在類中增加任何代碼。只有極少數情況下才需要定製代碼儲存或恢複對象狀態。這裡要注意:不是每個類都可序列化,有些類是不能序列化的,例如涉及線程的類與特定JVM有非常複雜的關係。
序列化機制:
序列化分為兩大部分:序列化和還原序列化。序列化是這個過程的第一部分,將資料分解成位元組流,以便儲存在檔案中或在網路上傳輸。還原序列化就是開啟位元組流並重構對象。對象序列化不僅要將基礎資料型別 (Elementary Data Type)轉換成位元組表示,有時還要恢複資料。恢複資料要求有恢複資料的對象執行個體。ObjectOutputStream中的序列化過程與位元組流串連,包括物件類型和版本資訊。還原序列化時,JVM用頭資訊產生對象執行個體,然後將對象位元組流中的資料複製到對象資料成員中。下面我們分兩大部分來闡述:
處理物件流程:
(序列化過程和還原序列化過程)
java.io包有兩個序列化對象的類。ObjectOutputStream負責將對象寫入位元組流,ObjectInputStream從位元組流重構對象。
我們先瞭解ObjectOutputStream類吧。ObjectOutputStream類擴充DataOutput介面。
writeObject()方法是最重要的方法,用於對象序列化。如果對象包含其他對象的引用,則writeObject()方法遞迴序列化這些對象。每個ObjectOutputStream維護序列化的對象參考資料表,防止發送同一對象的多個拷貝。(這點很重要)由於writeObject()可以序列化整組交叉引用的對象,因此同一ObjectOutputStream執行個體可能不小心被請求序列化同一對象。這時,進行反引用序列化,而不是再次寫入對象位元組流。
下面,讓我們從例子中來瞭解ObjectOutputStream這個類吧。
- // 序列化 today's date 到一個檔案中.
- FileOutputStream f = new FileOutputStream("tmp");
- ObjectOutputStream s = new ObjectOutputStream(f);
- s.writeObject("Today");
- s.writeObject(new Date());
- s.flush();
現在,讓我們來瞭解ObjectInputStream這個類。它與ObjectOutputStream相似。它擴充DataInput介面。ObjectInputStream中的方法鏡像DataInputStream中讀取Java基礎資料型別 (Elementary Data Type)的公開方法。readObject()方法從位元組流中還原序列化對象。每次調用readObject()方法都返迴流中下一個Object。對象位元組流並不傳輸類的位元組碼,而是包括類名及其簽名。readObject()收到對象時,JVM裝入頭中指定的類。如果找不到這個類,則readObject()拋出ClassNotFoundException,如果需要傳輸對象資料和位元組碼,則可以用RMI架構。ObjectInputStream的其餘方法用於定製還原序列化過程。
例子如下:
- //從檔案中還原序列化 string 對象和 date 對象
- FileInputStream in = new FileInputStream("tmp");
- ObjectInputStream s = new ObjectInputStream(in);
- String today = (String)s.readObject();
- Date date = (Date)s.readObject();
定製序列化過程:
序列化通常可以自動完成,但有時可能要對這個過程進行控制。java可以將類聲明為serializable,但仍可手工控制聲明為static或transient的資料成員。
例子:一個非常簡單的序列化類別。
- public class simpleSerializableClass implements Serializable{
- String sToday="Today:";
- transient Date dtToday=new Date();
- }
序列化時,類的所有資料成員應可序列化除了聲明為transient或static的成員。將變數聲明為transient告訴JVM我們會負責將變元序列化。將資料成員聲明為transient後,序列化過程就無法將其加進對象位元組流中,沒有從transient資料成員發送的資料。後面資料還原序列化時,要重建資料成員(因為它是類定義的一部分),但不包含任何資料,因為這個資料成員不向流中寫入任何資料。記住,物件流程不序列化static或transient。我們的類要用writeObject()與readObject()方法以處理這些資料成員。使用writeObject()與readObject()方法時,還要注意按寫入的順序讀取這些資料成員。
關於如何使用定製序列化的部分代碼如下:
- //重寫writeObject()方法以便處理transient的成員。
- public void writeObject(ObjectOutputStream outputStream) throws IOException{
- outputStream.defaultWriteObject();//使定製的writeObject()方法可以
- 利用自動序列化中內建的邏輯。
- outputStream.writeObject(oSocket.getInetAddress());
- outputStream.writeInt(oSocket.getPort());
- }
- //重寫readObject()方法以便接收transient的成員。
- private void readObject(ObjectInputStream inputStream) throws IOException,ClassNotFoundException{
- inputStream.defaultReadObject();//defaultReadObject()補充自動序列化
- InetAddress oAddress=(InetAddress)inputStream.readObject();
- int iPort =inputStream.readInt();
- oSocket = new Socket(oAddress,iPort);
- iID=getID();
- dtToday =new Date();
- }
完全定製序列化過程:
如果一個類要完全負責自己的序列化,則實現Externalizable介面而不是Serializable介面。Externalizable介面定義包括兩個方法writeExternal()與readExternal()。利用這些方法可以控制對象資料成員如何寫入位元組流.類實現Externalizable時,頭寫入物件流程中,然後類完全負責序列化和恢複資料成員,除了頭以外,根本沒有自動序列化。這裡要注意了。聲明類實現Externalizable介面會有重大的安全風險。writeExternal()與readExternal()方法聲明為public,惡意類可以用這些方法讀取和寫入對象資料。如果對象包含敏感資訊,則要格外小心。這包括使用安全套接或加密整個位元組流。到此為至,我們學習了序列化的基礎部分知識。關於序
列化的進階教程,以後再述。
參考資料:http://java.sun.com/j2se/1.3/docs/guide/serialization/spec/serialTOC.doc.html