上篇文章提到MongoDB內建GridFS,支援海量儲存。那麼GridFS具體是如何儲存的呢。有何特殊之處呢。
在實際系統開發中,經常會有上傳圖片或檔案的功能,這些檔案可能尺寸很大。。我們可以借用GridFS來輔助管理。 GridFS結構:
MongoDBGridFS由表名.files和表名.chunks構成,前者存檔案資訊,後者存檔案的內容,兩者再通過_id與files_id建立關聯。
.files:
.chunks:
一個fs.files集合中的一條記錄內容如下:
{ "_id" : ObjectId("58eb7864eb61ee19bcccb8b9"),//唯一id "filename" : "toolbars.xml",//檔案名稱 "length" : NumberLong(620),//檔案長度 "chunkSize" : 262144,//chunk大小 "uploadDate" : ISODate("2017-04-10T12:19:47.632Z"),//上傳時間 "md5" : "aefbb40f9e349f2bf7caf32407cf6f6b",//檔案md5值 "metadata" : { "InsertTime" : "2017/4/10 20:19:46", "userID" : "mjx" } //檔案其他資訊}
對應fs.chunks中的chunk:
{ "_id" : ObjectId("58eb7864eb61ee19bcccb8ba"),//chunk的id "files_id" : ObjectId("58eb7864eb61ee19bcccb8b9"),//檔案id "n" : 0,//檔案的第幾個chunk塊,如果檔案大於chunksize,會被分割成多個chunk快 "data" : { "$binary" : "", "$type" : "00" }//檔案位元據,這裡省略了具體內容}
檔案的存與讀:
~檔案存入GridFS過程,如果檔案大於chunksize,則把檔案分割成多個chunk(檔案片段),一般為256k/個,每個chunk將作為mongodb的一個文檔(document)被存在chunks集合中,最後再把檔案資訊存入到fs.files中。
~讀取檔案的時候,先根據查詢的條件,在fs.files中找到一個合適的記錄,得到“_id”的值,再根據這個值到fs.chunks中尋找所有“files_id”為“_id”的chunk,並按“n”排序,最後依次讀取chunk中“data”對象的內容,還原成原來的檔案。 總結:
對於mongodb,BSON格式的資料(文檔)儲存有尺寸限制,最大為16M。GridFS適合大檔案儲存體,剛好可以解決這個問題。