標籤:
NoSQL資料庫都被貼上不同用途的標籤,如MongoDB和CouchDB都是面向文檔的資料庫,但這並不意味著它們可以象JSON(JavaScript Object Notation,JavaScript對象標記)那樣以結構化資料形式儲存文字文件。
JSON被認為是XML的代替品,它是一個輕量級的,基於文本交換資料的標準,和XML一樣具有人類易讀的特性。簡單的JSON資料結構叫做對象,可能包括多種資料類型,如整型(int),字串(string),數組(array),日期(date),對象(object)和位元組數組(bytearray)。
面向文檔的資料庫與關聯式資料庫有著顯著的區別,面向文檔的資料庫用一個有組織的檔案來儲存資料,而不是用行來儲存資料,在MongoDB中,一組文檔被看作是一個集合,在關聯式資料庫中,許多行的集合被看作是一張表。
但同時它們的操作又是類似的,關聯式資料庫使用select,insert,update和delete動作表中的資料,面向文檔的資料庫使用query,insert,update和remove做意義相同的操作。
MongoDB中對象的最大尺寸被限制為4MB,但對象的數量不受限制,MongoDB可以通過叢集加快操作的執行速度,當資料庫變得越來越大時,可以向叢集增加伺服器解決效能問題。
Mongo是一個高效能,開源,無模式的文檔型資料庫,它在許多情境下可用於替代傳統的關係型資料庫或鍵/值儲存方式。Mongo使用C++開發,提供了以下功能:
◆面向集合的儲存:適合儲存物件及JSON形式的資料。
◆動態查詢:Mongo支援豐富的查詢運算式。查詢指令使用JSON形式的標記,可輕易查詢文檔中內嵌的對象及數組。
◆完整的索引支援:包括文檔內嵌對象及數組。Mongo的查詢最佳化工具會分析查詢運算式,並產生一個高效的查詢計劃。
◆查詢監視:Mongo包含一個監視工具用於分析資料庫操作的效能。
◆複製及自動容錯移轉:Mongo資料庫支援伺服器之間的資料複製,支援主-從模式及伺服器之間的相互複製。複製的主要目標是提供冗餘及自動容錯移轉。
◆高效的傳統儲存方式:支援位元據及大型物件(如照片或圖片)。
◆自動分區以支援雲層級的伸縮性(處於早期alpha階段):自動分區功能支援水平的資料庫叢集,可動態添加額外的機器。
MongoDB的主要目標是在鍵/值儲存方式(提供了高效能和高度伸縮性)以及傳統的RDBMS系統(豐富的功能)架起一座橋樑,集兩者的優勢於一身。根據官方網站的描述,Mongo適合用於以下情境:
◆網站資料:Mongo非常適合即時的插入,更新與查詢,並具備網站即時資料儲存所需的複製及高度伸縮性。
◆緩衝:由於效能很高,Mongo也適合作為資訊基礎設施的緩衝層。在系統重啟之後,由Mongo搭建的持久化緩衝層可以避免下層的資料來源過載。
◆大尺寸,低價值的資料:使用傳統的關係型資料庫儲存一些資料時可能會比較昂貴,在此之前,很多時候程式員往往會選擇傳統的檔案進行儲存。
◆高伸縮性的情境:Mongo非常適合由數十或數百台伺服器組成的資料庫。Mongo的路線圖中已經包含對MapReduce引擎的內建支援。
◆用於對象及JSON資料的儲存:Mongo的BSON資料格式非常適合文檔化格式的儲存及查詢。
自然,MongoDB的使用也會有一些限制,例如它不適合:
◆高度事務性的系統:例如銀行或會計系統。傳統的關係型資料庫目前還是更適用於需要大量原子性複雜事務的應用程式。
◆傳統的商業智慧應用:針對特定問題的BI資料庫會對產生高度最佳化的查詢方式。對於此類應用,資料倉儲可能是更合適的選擇。
◆需要SQL的問題
MongoDB支援OS X、Linux及Windows等作業系統,並提供了Python,PHP,Ruby,Java及C++語言的驅動程式,社區中也提供了對Erlang及.NET等平台的驅動程式。
為什麼MongoDB適合大資料的儲存?