摘 要: 與常見的資料庫相比,嵌入式資料庫具有體積小、功能齊備、可移植性、健壯性等特點,本文分析和比較了典型的嵌入式資料庫SQLite和Berkeley DB。首先從體繫結構、子系統間調用關係、任務執行過程等角度對SQLite和Berkeley DB進行了詳細分析,然後重點從資料類型、儲存方式、模式、資料庫引擎和錯誤處理及加密功能等方面討論了SQLite和Berkeley DB的異同點,最後列舉了一個基於ARM—Linux的SQLite應用執行個體。
關鍵詞: SQLite、Berkeley DB、SQL、虛擬資料庫引擎(VDBE)
引言
隨著電腦技術與其它學科間的不斷交融、滲透,資料庫應用的範圍更加深入和具體。那些僅適用於PC機,體積龐大、延時較長的資料庫技術已不能滿足針對性較強的嵌入式系統開發的需求。SOLite和Berkeley DB是目前應用較廣泛、技術較穩定的兩種嵌入式資料庫。然而,國內對嵌入式資料庫的研究起步較晚,還沒能引起更多人的關注。更多人熟悉那些基於C/S或B /S結構的關係型資料庫來實現資料的儲存、檢索等功能。然而,在嵌入式系統中,由於軟硬體資源有限,不可能安裝龐大的資料庫伺服器,而使用者的需求可能由一個簡單的基於磁碟檔案的資料庫系統就能實現,這僅僅是利用了那些資料庫的基本特性。此時,對嵌入式資料庫的研究就顯得尤為重要了。
1嵌入式資料庫
嵌入式資料庫通常是與嵌入式作業系統及具體的應用整合在一起,無需獨立運行資料庫引擎,由程式直接調用相應的API就可實現對資料的存取操作。嵌入式系統的開發環境決定了其資料庫的特點:
1、 體積適當
由於嵌入式系統自身的特點,對資料的儲存和程式的運行都有較強的空間限制,所以嵌入式資料庫首先應該保障的就是適當的體積。進一步來說就是佔用盡量少的ROM、RAM及CPU的資源。
2、 功能齊備
嵌入式系統開發中,使用者需求決定了需要一個大小適中、功能齊備的資料庫來實現資料
管理,這就使得開發人員要採用一個能夠提供完備開發文檔且易於開發的資料庫技術。此外,
國家863項目2002AA714023,研究生精品課程資助05531451
在嵌入式裝置中,資料庫的管理對使用者來說是透明的,這就要求此資料庫能夠自動完成啟動初始化、日誌管理、資料壓縮、備份、資料恢複等功能;而且嵌入式裝置經常有不可預料的硬複位,這就需要此資料庫有高度的健壯性。
3、 可移植性
嵌入式系統的平台種類繁多,因此嵌入式資料庫應有一定的可移植性,以適用於不同的軟硬體平台。
4、代碼開源
開源的代碼在產品的開發過程中不僅可以減少開發成本,更重要的是為後期的維護完善和穩定運行都提供了最為徹底的解決方案。
2 SQLite
SQLite是D.理查德.希普用一個小型的C庫開發的一種強有力的嵌入式關聯式資料庫管理體制。雖然功能較Berkeley DB稍顯遜色,但它簡單易學、速度較快,同時提供了豐富的資料庫介面,提供了對SQL92的大多數支援:支援多表和索引、事務、視圖、觸發和一系列的使用者介面及驅動。
SQLite的體繫結構大體上可以分成八個主要的子系統,1所示。對資料庫進行的各種操作都是按照此順序,逐一執行的。頂層是標記處理器(tokenize)和分析器(parser)。SQLite有自己高度最佳化的代碼產生器,可以快速、高效地生產出代碼。底部是經過最佳化的B樹,這樣有助於運行在可調整的頁面緩衝上時,對磁碟的尋找降低到最小。再往下是頁面快取,它作用在OS的抽象層之上,這樣的體繫結構使資料庫的可移植性變為可能。
該體繫結構的核心是虛擬資料庫引擎(VDBE)。VDBE完成與資料操作相關的全部任務,並且是客戶和儲存之間資訊交換的中間單元。從各個角度分析,它都是SQLite的核心。當SQL語句被分析後,VDBE便開始工作。代碼產生器將分析樹翻譯成一個袖珍程式,隨後這些袖珍程式又被組合成VDBE的虛擬機器語言表示的一系列指令。如此反覆,VDBE執行每條指令,最終完成SQL語句指定的查詢要求。
SQLite有以下特性:支援ACID事務、零配置―無需安裝和管理配置、儲存在單一磁碟檔案中的一個完整的資料庫、資料庫檔案可以在不同位元組順序的機器間自由共用、支援資料庫大小至2TB、足夠小、全部源碼大致3萬行C代碼,250KB、比目前流行的大多資料庫運行速度快,提供了對事務功能和並發處理的支援、應用Transaction既保證了資料的完整性,也會提高運行速度,因為多條語句一起提交給資料庫的速度會比逐一提交的方式更快、獨立、沒有額外依賴。
3 Berkeley DB
Berkeley DB是由sleepycat software開發的輕量級嵌入式資料庫,它不僅適用於嵌入式系統,而且可以直接連接到應用程式內部,和應用程式運行在同一地址空間。傳統的資料庫一般作為獨立伺服器工作,而Berkeley DB是軟體開發庫,開發人員將它嵌入到應用程式中,應用程式本身就是一個伺服器,而只是利用嵌入式資料庫開發來實現定製的資料庫邏輯,避免了與應用伺服器處理序間通訊的開銷,因此Berkeley DB具有較高的運行效率,適用於資源受限的嵌入式系統。
一般而言,Berkeley DB資料庫系統可以大致分為五個子系統,2所示。
1、 存取管理子系統(Access Methods)
該子系統為建立和訪問資料庫檔案提供基本的支援。在沒有交易管理的情況下,該子系統中的模組可單獨使用,為應用程式提供快速高效的資料存取服務。
2、 記憶體池管理子系統(Memory Pool)
該子系統就是Berkeley DB所使用的通用共用記憶體緩衝區,該子系統可以被應用程式單獨使用。
3、 事務子系統(Transaction)
該子系統為Berkekey DB提供交易管理功能,保證操作的原則性、一致性和孤立性。事務子系統適用於對需要事務保證的資料進行修改的場合。
4、 鎖子系統(Locking)
該子系統提供進程之間以及進程內部的並發管理機制,為系統提供多使用者讀取和單使用者修改同一對象的共用控制。該子系統可以被應用程式單獨使用。
5、 日誌子系統(Logging)
該子系統採用的是先寫日誌的策略,支援事務子系統進行資料恢複,保證資料一致性。
4、SQLite與Berkeley DB的異同
通過上面的一些介紹,也許會對SQLite和Berkeley DB有了一定的瞭解。從目前的趨勢看,這兩款嵌入式資料庫有著旺盛的生命力,較好的應用領域及發展空間。筆者翻閱了大量的資料,從各個角度,對它們的異同進行了多方面,多層次的比較,如表1所示。
表1 SQLite與Berkeley DB的異同
特性
SQLite
Berkeley DB
是否為關聯式資料庫
是否支援SQL
開發語言
資料類型
儲存方式
儲存模式
資料庫引擎
適用系統
錯誤處理
加密功能
是否免費
難易程度
是
是
C語言
無
轉換成ASCII碼
Btree
虛擬
從ARM/Linux到SPARC/Solaris多種硬體平台
較少
弱
全部
較易
否
否
C、Java語言
無
原樣儲存
Btree、Hash、Queue和Recno
無
UNIX/POSIX systems、Win32及嵌入式系統WinCE、VxWorks等
較詳細
強
部分
較難
通過此表我們可以較為直觀地看到,SQLite和Berkeley DB在資料庫類型、開發語言、儲存方式、模式等方面有著較大的差異。下面筆者就對其中某些重要方面進行相對詳細的論述:
1、 資料庫類型
SQLite基於關聯式資料庫模式,支援絕大多數標準的SQL92語句,在很大程度上實現了ANSI SQL92標準,特別是支援視圖、觸發器、事務,支援嵌套SQL。它通過SQL編譯器(SQL Complier)來實現SQL語言對資料庫進行操作,採用單檔案存放資料庫。在動作陳述式上更類似關係型資料庫的產品使用,非常方便。這也就使得那些曾經有過PC機資料庫經驗的人,對SQLite的學習變得易如反掌。
此外,SQLite也有API的概念,而且極其便於使用,只需要三個用來執行SQL和獲得資料的函數。它還是可以擴充的,允許程式員自訂函數,然後以callback的形式集合進去。C語言API是指令碼介面的基礎,如已經發布的(Tcl介面)。開放源碼團體已經擴充了眾多的客戶介面、適配器、驅動等,這就使得其他語言對SQLite的使用也成為可能。
Berkeley DB不是關係型的資料庫,不能應用標準的SQL語句對資料庫操作,對它的操作要調用專用的API實現。這些API提供了查詢、插入、刪除等功能。使用 Berkeley DB提供的函數來進行資料庫的訪問和管理並不複雜。在大多數場合下,只需按照統一的介面標準進行調用就可以完成最基本的操作。
2、 儲存方式及模式
SQLite只提供了Btree儲存資料的模式。對位元據,SQLite不能直接儲存;但可以先將二進位的資料轉換成ASCII編碼,然後再儲存。Base64編碼機制是最常見的把位元據轉換成ASCII編碼的手段。在SQLite的C語言代碼encode.c中,提供了Base64編碼的功能。
Berkeley DB對任何存入的資料都是按原樣直接儲存到資料檔案中去,無論其是位元據還是ASCII或Unicode等編碼的文本。Berkeley DB提供了四種儲存資料的模式:Btree、Hash、Queue和Recno。在開啟資料庫的時候,要指定一種儲存模式。
對於以上各種儲存模式的具體定義、優缺點、及適用範圍,由於篇幅有限,在此就不過多敘述,如有需要可參閱相關資料。
3、 資料類型
SQLite最大的特點在於其資料類型為無資料類型(typelessness)。這意味著可以儲存任何類型的資料到所想要儲存的任何錶的任何列中,無論這列聲明的資料類型是什麼。雖然在產生表結構的時候,要聲明每個域的資料類型,但SQLite並不做任何檢查。開發人員要靠自己的程式來控制輸入與讀出資料的類型。這裡有一個例外,就是當主鍵為整型值時,如果要插入一個非整型值時會產生異常。
雖然,SQLite允許忽略資料類型,但是,仍然建議在Create Table語句中指定資料類型,因為資料類型有利於增強程式的可讀性。另外,雖然在插入或讀出資料的時候是不區分類型的,但在比較的時候,不同資料類型是有區別的。
在Berkeley DB中關鍵字(key)和資料(data)是用來進行資料庫管理的基礎,由這兩者構成的key/data對,組成了資料庫中的一個基本結構單元。通過使用這種方式,用API函數訪問資料庫時,只需提供關鍵字就能夠訪問到相應的資料。關鍵字和資料在Berkeley DB中都是用一個名為DBT的簡單結構來表示的,它的作用主要是儲存相應的記憶體位址及其長度。
5 應用
SQLite嵌入式資料庫提供了以源碼發布的方式,要在眾多的硬體平台進行移植,可以根據不同平台對源碼進行交叉編譯來實現。編譯主要有以下幾個步驟:
1、到http://www.sqlite.org/的cvs中下載最新的原始碼包,解壓後將產生sqlite目錄,另外建立並轉到一個與sqlite目錄平行的同級目錄,如make目錄。
2、用“echo$PATH”命令查看PATH中是否已經包含交叉編譯工具arm-linux-gcc。
3、為了在ARM-Linux下能正常運行sqlite,需要對sqlite/src/sqliteInt.h作一定的修改,以確保btree(B樹)有正確的變數大小,如“ptr”和“char”。不同體繫結構的Linux,如X86和ARM,會有些差別。對於ARM-Linux可以找到如下部分:
# ifndef INTPTR_TYPE
# if SQLITE_PTR_SZ==4
# define INTPTR_TYPE int
# else
# define INTPTR_TYPE long long
# endif
在上面的代碼前加上一句
# define SQLITE_PTR_SZ 4
這樣後面的“typedef INTPTR_TYPE ptr;”就是定義的“int”類型,而不是“long long”。
4、使用configure進行一些配置。修改sqlite目錄下的configure,讓configure不去檢查交叉編譯環境。由於篇幅有限不再詳述。
5、修改Makefile檔案。將程式碼BCC=arm-linux-gcc-g-O2改成BCC=gcc-g-O2。另外,一般是以靜態連結的形式將sqlite放到ARM-Linux的硬體板上啟動並執行,所以繼續修改Makefile,找到標記為sqlite:的程式碼片段,將其中的 libsqlite.la改成.libs/libsqlite.a。做完上述修改,用make產生sqlite、libsqlite.a、 libsqlite.so。為了減小執行檔案大小可以用strip處理,去掉其中的調試資訊。
6、在ARM板上運行sqlite。將sqlite拷貝到ARM板上,方法很多,需要根據具體的情況來選擇。如ftp、cm-dftp、wget等。將sqlite下載到ARM板的/tmp目錄,因為此目錄是可寫的。修改許可權並運行:
chmod+wx sqlite
./sqlite test.sqlite
會出現
sqlite>
如果一切正常,現在sqlite已經在ARM-Linux下跑了起來,然後就可以基於此進行下一步的應用開發了。
6 結語
嵌入式資料庫SQLite和Berkeley DB,在體積上、功能上、運行速度及難易程度都存在著或多或少的異同。但它們都有能夠充分適應硬體的能力,能很好地適應嵌入式系統的需要。就筆者來看,SQLite功能雖不及Berkeley DB強大,但它的設計思想是小型、快速和最小化的管理。這就使得SQLite在大小和功能之間找到了一個理想的平衡點,而且完全的開原始碼使其可以稱得上是理想的“嵌入式資料庫”。當然在具體的嵌入式應用中可以根據具體情況選擇應用。