MongoDB之bson的介紹
1. 什麼是bson
BSON是一種類json的一種二進位形式的儲存格式,簡稱Binary JSON,它和JSON一樣,支援內嵌的文檔對象和數組對象,但是BSON有JSON沒有的一些資料類型,如Date和BinData類型。
BSON可以做為網路資料交換的一種儲存形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的儲存形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想,
BSON有三個特點:輕量性、可遍曆性、高效性
{“hello":"world"} 這是一個BSON的例子,其中"hello"是key name,它一般是cstring類型,位元組表示是cstring::= (byte*) "/x00" ,其中*表示零個或多個byte位元組,/x00表示結束符;後面的"world"是value值,它的類型一般是string,double,array,binarydata等類型。
2. bson在MongoDB中的使用
MongoDB使用了BSON這種結構來儲存資料和網路資料交換。把這種格式轉化成一文檔這個概念(Document),因為BSON是schema-free的,所以在MongoDB中所對應的文檔也有這個特徵,這裡的一個Document也可以理解成關聯式資料庫中的一條記錄(Record),只是這裡的Document的變化更豐富一些,如Document可以嵌套。
MongoDB以BSON做為其儲存結構的一種重要原因是其可遍曆性。
3. 幾個BSON的例子3.1 一個Document的BSON表示:
{<br />title:"MongoDB",<br />last_editor:"192.168.1.122",<br />last_modified:new Data("27/06/2011"),<br />body:"MongoDB introduction",<br />categories:["Database","NoSQL","BSON"],<br />revieved:false<br />}
這是一個簡單的BSON結構體,其中每一個element都是由key/value對組成的
3.2 一個嵌套的例子
{<br />name:"lemo",<br />age:"12",<br />address:{<br />city:"suzhou",<br />country:"china",<br />code:215000<br />}<br />scores:[<br />{"name":"english","grade:3.0},<br />{"name":"chinese","grade:2.0}<br />]<br />}
這是一種相對複雜點的例子,其中包括了地址對象和分數對象數組,這裡使用了嵌套文檔對象與文檔對象資料來表示單個學生的資訊,這種嵌套的文檔結構要使用關聯式資料庫來做是比較複雜的。
4. BSON c++ 程式碼分析
MongoDB原始碼樹中包括了BSON的程式碼程式庫,你只要包含bson.h這個標頭檔就行了,其中有四個類是比較重要的:
* mongo::BSONObj,這個是BSON對象的表示<br />* mongo::BSONElement,這個是BSON對象中元素的表示方法<br />* mongo::BSONObjBuilder,這是構建BSON對象的類<br />* mongo::BSONObjIterator,這是用來遍曆BSON對象中每一個元素的一個迭代器
下面是建立一個BSON對象
BSONObjBuilder b;<br />b.append("name","lemo"),<br />b.append("age",23);<br />BSONObj p = b.obj();
或者
BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj();<br />
或者用流的方法來
BSONObjBuilder b;<br />b << "name" << "lemo" << "age" << 23;<br />BSONObj p = b.obj();
或者用宏來建立一個對象
BSONObj p = BSON( "name" << "Joe" << "age" << 33 );<br />
這裡分析一下這四個類的一些代碼:
mongo::BSONObj主要是用於儲存BSON對象的,具體的儲存格式如下
<unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO<br /> -------------------- ------------- ----------------- ---- ---<br />totalSize: 一個總的位元組長度,包含自身<br />BSONType: 物件類型,這裡有Boolean,String,Date等類型,具體可以參考bsontypes.h這個檔案<br />FieldName: 這裡表示欄位名<br />Data: 這裡是放具體的資料,資料的儲存方式根據不同的BSONType來<br />* : 表示可以有多個元素組成<br />EOO: 這是一個結束符,一般是/x00來表示
一般來說,BSONObj的建立都是通過BSONObjBuilder來做的,除非你已經得到了其位元組流,那可以直接產生BSONObj
mongo::BSONElement 它主要是用於儲存物件中的單個元素,儲存格式如下
<type><fieldName><value>
這個對象主要是指向BSONObj對象中具體元素的地址,它不實際儲存元素的值。
mongo::BSONObjBuilder 它主要是用於產生BSONObj,這個對象整合了StringBuilder,它主要用於儲存實際的位元組點,用於替換std::stringstream,而這個StringBuilder整合了BufBuilder,這是一個可以動態增長記憶體緩衝區,但最大容量不能超過64MB的大小,也就是說一個BSONObj最大不能超過64MB。
mongo::BSONOBjIterator 它主要是用來遍曆BSONObj對象中的每一個元素,提供了類似於stl iterator的一些介面,它還提供了一個ForEach宏來提供更方便的操作,如
if (foo) {<br /> BSONForEach(e, obj)<br /> doSomething(e);<br /> }
5. 參考
* http://www.mongodb.org/pages/viewpage.action?pageId=16646453
* http://bsonspec.org/
* http://www.mongodb.org/display/DOCS/BSON