實現一個微型資料庫,實現微型資料庫

來源:互聯網
上載者:User

實現一個微型資料庫,實現微型資料庫

自己寫一個簡單的資料庫,原理大概有以下幾點:

一、資料以文本形式儲存

將所要儲存的資料寫入文字檔,這個文字檔就是資料庫。

為了方便讀取,資料必須分為記錄,每一條記錄的長度規定為等長。

舉例:假定每條記錄的長度是800位元組,那麼第5條記錄的開始位置就在3200位元組。

大多數的時候我們不知道某一條記錄在第幾個位置,只知道主鍵的值。這時為了讀取資料,可以一條條比對記錄。但是這樣做的效率太低。實際應用中,資料庫往往採用B樹格式儲存資料

 

二、關於B樹

要理解B樹先需要理解二叉尋找樹

說二叉尋找樹是一種尋找效率非常高的資料結構,它有三個特點:

(1)每個節點最多隻有兩個子樹。

(2)左子樹都為小於父節點的值,右子樹都為大於父節點的值。

(3)在n個節點中找到目標值,一般只需要log(n)次比較。

 

二叉尋找樹的結構不適合資料庫,因為他的尋找效率與層數有關。越處在下層的資料,就需要越多次的比較。極端的情況下,n個資料需要n次比較才能找到目標值。對於資料庫來說,每進入一層,就要從硬碟讀取一次資料,這非常致命,因為硬碟的讀取時間遠遠大於資料處理時間,資料庫讀取硬碟的次數越少越好。

 

B樹是對二叉尋找樹的改進。它的設計思想是,將相關資料盡量集中在一起,以便一次讀取多個資料,減少硬碟操作次數。

B樹的特點:

(1)一個節點可以容納多個值。

(2)除非資料已經填滿,否則不會增加新的層,也就是說,B樹追求“層”越少越好。

(3)子節點的值,與父節點中的值有嚴格的大小對應關係。一般來說,如果父節點有a個值,那麼就有a+1個子節點。比如中,父節點有兩個值(7和16),就應對應三個子節點,第一個子節點都是小於7的值,最後一個子節點都是大於16的值,中間的子節點就是7和16之間的值。

 

這種資料結構非常有利於減少讀取硬碟的次數。假定一個節點可以容納100個值,那麼3層的B樹可以容納100萬個資料,如果換成二叉尋找樹,則需要20層。假定作業系統一次讀取一個節點,並且根節點保留在記憶體中,那麼B樹在100萬個資料中尋找目標值,只需要讀取兩次硬碟。

 

三、索引

資料庫以B樹格式儲存,只解決了按照“主鍵”尋找資料的問題。如果想尋找其他欄位,就需要建立檢索(index)。

所謂索引,就是以某個欄位為關鍵字的B樹檔案,假定一張“僱員表”,包含了員工號(主鍵)和姓名兩個欄位,可以對姓名建立索引檔案,該檔案以B樹格式對姓名進行儲存,每個姓名後面是其在資料庫中的位置(即第幾條記錄)。尋找姓名的時候,先從索引中找到對應的第幾條記錄,然後再從表格中讀取。這種索引尋找方法,叫做“索引順序存取方法”,縮寫為ISAM。它已經有多種實現,只要使用這些程式碼程式庫,就能自己寫一個最簡單的資料庫。

 

四、進階功能

部署了最基本的資料存取(包括索引)以後,還可以實現一些進階功能。

(1)SQL語言是資料庫通用操作語言,所以需要一個SQL解析器,將SQL命令解析為對應的ISAM操作。

(2)資料庫連接(join)是指資料庫的兩張表通過“外鍵”,建立串連關係。你需要對這種操作進行最佳化。

(3)資料庫事務(transaction)是指批量進行一系列資料庫操作,只要有一步不成功,整個操作都不成功。所以需要有一個“動作記錄”,以便失敗時對操作進行復原。

(4)備份機制:儲存資料庫的副本。

(5)遠程操作:使得使用者可以在不同的機器上,通過TCP/IP協議操作資料庫。

 

 

部分內容來自點擊開啟連結,後續依然會不斷更新完善。

 

 

 


如果自己要建立一個小型資料庫,你有什建議?用sql,有什方面的資料庫選擇?

資料庫設計方法、規範與技巧
一、資料庫設計過程
資料庫技術是資訊資源管理最有效手段。資料庫設計是指對於一個給定的應用環境,構造最優的資料庫模式,建立資料庫及其應用系統,有效儲存資料,滿足使用者資訊要求和處理要求。
資料庫設計中需求分析階段綜合各個使用者的應用需求(現實世界的需求),在概念設計階段形成獨立於機器特點、獨立於各個DBMS產品的概念模式(資訊世界模型),用E-R圖來描述。在邏輯設計階段將E-R圖轉換成具體的資料庫產品支援的資料模型如關聯式模式,形成資料庫邏輯模式。然後根據使用者處理的要求,安全性的考慮,在基本表的基礎上再建立必要的視圖(VIEW)形成資料的外模式。在實體設計階段根據DBMS特點和處理的需要,進行實體儲存體安排,設計索引,形成資料庫內模式。
1. 需求分析階段
需求收集和分析,結果得到資料字典描述的資料需求(和資料流圖描述的處理需求)。
需求分析的重點是調查、收集與分析使用者在資料管理中的資訊要求、處理要求、安全性與完整性要求。
需求分析的方法:調查組織機構情況、調查各部門的商務活動情況、協助使用者明確對新系統的各種要求、確定新系統的邊界。
常用的調查方法有: 跟班作業、開調查會、請專人介紹、詢問、設計調查表請使用者填寫、查閱記錄。
分析和表達使用者需求的方法主要包括自頂向下和自底向上兩類方法。自頂向下的結構化分析方法(Structured Analysis,簡稱SA方法)從最上層的系統組織機構入手,採用逐層分解的方式分析系統,並把每一層用資料流圖和資料字典描述。
資料流程圖達了資料和處理過程的關係。系統中的資料則藉助資料字典(Data Dictionary,簡稱DD)來描述。
資料字典是各類資料描述的集合,它是關於資料庫中資料的描述,即中繼資料,而不是資料本身。資料字典通常包括資料項目、資料結構、資料流、資料存放區和處理過程五個部分(至少應該包含每個欄位的資料類型和在每個表內的主外鍵)。
資料項目描述={資料項目名,資料項目含義說明,別名,資料類型,長度,
取值範圍,取值含義,與其他資料項目的邏輯關係}
資料結構描述={資料結構名,含義說明,組成:{資料項目或資料結構}}
資料流描述={資料流名,說明,資料流來源,資料流去向,
組成:{資料結構},平均流量,高峰期流量}
資料存放區描述={資料存放區名,說明,編號,流入的資料流,流出的資料流,
組成:{資料結構},資料量,存取方式}
處理流程說明={處理過程名,說明,輸入:{資料流},輸出:{資料流},
處理:{簡要說明}}
2. 概念結構設計階段
通過對使用者需求進行綜合、歸納與抽象,形成一個獨立於具體DBMS的概念性模型,可以用E-R圖表示。
概念性模型用於資訊世界的建模。概念性模型不依賴於某一個DBMS支援的資料模型。概念性模型可以轉換為電腦上某一DBMS支援的特定資料模型。
概念性模型特點:
(1) 具有較強的語義表達能力,能夠方便、直接地表達應用中的各種語義知識。
(2) 應該簡單、清晰、易於使用者理解,是使用者與資料庫設計人員之間進行交流的語言。
概念性模型設計的一種常用方法為IDEF1X方法,它就是把實體-聯絡方法應用到語義資料模型中的一種語義模型化技術,用於建立系統資訊模型。
使用IDEF1X方法建立E-R模型的步驟如下所示:
2.1 第零步——初始化工程
這個階段的任務是從目的描述和範圍描述開始,確定建模目標,開發建模計劃,組織建模......餘下全文>>
 
如果要建一個小型資料庫,同時做一個簡單的介面實現對資料庫的增刪查改,需要一些什工具?

asp + sqlserver就行,編程簡單,b/s結構的看作也舒服,不用安裝
 

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.