轉載來自於-----http://blog.csdn.net/sallay/article/details/3668614,原帖地址:http://hi.baidu.com/waybq/item/a4490f026f9859d21ef046a4
硬碟是現在電腦上最常用的儲存空間之一。我們都知道,電腦之所以神奇,是因為它具有高速分析處理資料的能力。而這些資料都以檔案的形式儲存在硬碟裡。不過,電腦可不像人那麼聰明。在讀取相應的檔案時,你必須要給出相應的規則。這就是分區概念。
分區從實質上說就是對硬碟的一種格式化。當我們建立分區時,就已經設定好了硬碟的各項物理參數,指定了硬碟主引導記錄(即Master Boot Record,一般簡稱為MBR)和引導記錄備份的存放位置。而對於檔案系統以及其他動作系統管理硬碟所需要的資訊則是通過以後的進階格式化,即Format命令來實現。面、磁軌和扇區硬碟分區後,將會被劃分為面(Side)、磁軌(Track)和扇區(Sector)。需要注意的是,這些只是個虛擬概念,並不是真正在硬碟上劃軌道。
先從面說起,硬碟一般是由一片或幾片圓形薄膜疊加而成。我們所說,每個圓形薄膜都有兩個“面”,這兩個面都是用來儲存資料的。按照面的多少,依次稱為0面、1面、2面……由於每個面都專有一個讀寫磁頭,也常用0頭(head)、1頭……稱之。按照硬碟容量和規格的不同,硬碟面數(或頭數)也不一定相同,少的只有2面,多的可達數十面。各面上磁軌號相同的磁軌合起來,稱為一個柱面(Cylinder)。
上面我們提到了磁軌的概念。那麼究竟何為磁軌呢?由於磁碟是旋轉的,則連續寫入的資料是排列在一個圓周上的。我們稱這樣的圓周為一個磁軌。如果讀寫磁頭沿著圓形薄膜的半徑方向移動一段距離,以後寫入的資料又排列在另外一個磁軌上。根據硬碟規格的不同,磁軌數可以從幾百到數千不等;一個磁軌上可以容納數KB的資料,而主機讀寫時往往並不需要一次讀寫那麼多,於是,磁軌又被劃分成若干段,每段稱為一個扇區。一個扇區一般存放512位元組的資料。扇區也需要編號,同一磁軌中的扇區,分別稱為1扇區,2扇區……
電腦對硬碟的讀寫,處於效率的考慮,是以扇區為基本單位的。即使電腦只需要硬碟上儲存的某個位元組,也必須一次把這個位元組所在的扇區中的512位元組全部讀入記憶體,再使用所需的那個位元組。不過,在上文中我們也提到,硬碟上面、磁軌、扇區的劃分表面上是看不到任何痕迹的,雖然磁頭可以根據某個磁軌的應有半徑來對準這個磁軌,但怎樣才能在首尾相連的一圈扇區中找出所需要的某一扇區呢?原來,每個扇區並不僅僅由512個位元組組成的,在這些由電腦存取的資料的前、後兩端,都另有一些特定的資料,這些資料構成了扇區的界限標誌,標誌中含有扇區的編號和其他資訊。電腦就憑藉著這些標誌來識別扇區。硬碟的資料結構
在上文中,我們談了資料在硬碟中的儲存的一般原理。為了能更深入地瞭解硬碟,我們還必須對硬碟的資料結構有個簡單的瞭解。硬碟上的資料按照其不同的特點和作用大致可分為5部分:MBR區、DBR區、FAT區、DIR區和DATA區。
我們來分別介紹一下:
1、MBR區
MBR(Main Boot Record 主引導記錄區)位於整個硬碟的0磁軌0柱面1扇區。不過,在總共512位元組的主開機磁區中,MBR只佔用了其中的446個位元組,另外的64個位元組交給了DPT(Disk Partition Table硬碟分區表),最後兩個位元組“55,AA”是分區的結束標誌。這個整體構成了硬碟的主開機磁區。
主引導記錄中包含了硬碟的一系列參數和一段引導程式。其中的硬碟引導程式的主要作用是檢查分區表是否正確並且在系統硬體完成自檢以後引導具有啟用標誌的分區上的作業系統,並將控制權交給啟動程式。MBR是由分區程式(如Fdisk.exe)所產生的,它不依賴任何作業系統,而且硬碟引導程式也是可以改變的,從而實現多系統共存。
下面,我們以一個執行個體讓大家更直觀地來瞭解主引導記錄:
例:80 01 01 00 0B FE BF FC 3F 00 00 00 7E 86 BB 00 在這裡我們可以看到,最前面的“80”是一個分區的啟用標誌,表示系統可引導;“01 01 00”表示分區開始的磁頭號為01,開始的扇區號為01,開始的柱面號為00;“0B”表示分區的系統類別型是FAT32,其他比較常用的有04(FAT16)、07(NTFS);“FE BF FC”表示分區結束的磁頭號為254,分區結束的扇區號為63、分區結束的柱面號為764;“3F
00 00 00”表示首扇區的相對扇區號為63;“7E 86 BB 00”表示總扇區數為12289622。
2、DBR區
DBR(Dos Boot Record)是作業系統引導記錄區的意思。它通常位於硬碟的0磁軌1柱面1扇區,是作業系統可以直接存取的第一個扇區,它包括一個引導程式和一個被稱為BPB(Bios Parameter Block)的本分區參數記錄表。引導程式的主要任務是當MBR將系統控制權交給它時,判斷本分區跟目錄前兩個檔案是不是作業系統的引導檔案(以DOS為例,即是Io.sys和Msdos.sys)。如果確定存在,就把它讀入記憶體,並把控制權 交給該檔案。BPB參數區塊記錄著本分區的起始扇區、結束扇區、檔案儲存體格式、硬碟介質描述符、根目錄大小、FAT個數,配置單位的大小等重要參數。DBR是由進階格式化程式(即Format.com等程式)所產生的。
3、FAT區
在DBR之後的是我們比較熟悉的FAT(File Allocation Table檔案配置表)區。在解釋檔案配置表的概念之前,我們先來談談簇(Cluster)的概念。檔案佔用磁碟空間時,基本單位不是位元組而是簇。一般情況下,磁碟片每簇是1個扇區,硬碟每簇的扇區數與硬碟的總容量大小有關,可能是4、8、16、32、64…… 同一個檔案的資料並不一定完整地存放在磁碟的一個連續的地區內,而往往會分成若干段,像一條鏈子一樣存放。這種儲存方式稱為檔案的鏈式儲存。由於硬碟上儲存著段與段之間的串連資訊(即FAT),作業系統在讀取檔案時,總是能夠準確地找到各段的位置並正確讀出。
為了實現檔案的鏈式儲存,硬碟上必須準確地記錄哪些簇已經被檔案佔用,還必須為每個已經佔用的簇指明儲存後繼內容的下一個簇的簇號。對一個檔案的最後一簇,則要指明本簇無後繼簇。這些都是由FAT表來儲存的,表中有很多表項,每項記錄一個簇的資訊。由於FAT對於檔案管理的重要性,所以FAT有一個備份,即在原FAT的後面再建一個同樣的FAT。初形成的FAT中所有項都標明為“未佔用”,但如果磁碟有局部損壞,那麼格式化程式會檢測出損壞的簇,在相應的項中標為“壞簇”,以後存檔案時就不會再使用這個簇了。FAT的項數與硬碟上的總簇數相當,每一項佔用的位元組數也要與總簇數相適應,因為其中需要存放簇號。FAT的格式有多種,最為常見的是FAT16和FAT32。
4、DIR區
DIR(Directory)是根目錄區,緊接著第二FAT表(即備份的FAT表)之後,記錄著根目錄下每個檔案(目錄)的起始單元,檔案的屬性等。定位檔案位置時,作業系統根據DIR中的起始單元,結合FAT表就可以知道檔案在硬碟中的具體位置和大小了。
5、資料(DATA)區
資料區是真正意義上的資料存放區的地方,位於DIR區之後,佔據硬碟上的大部分資料空間。
一、硬碟的物理結構:
硬碟儲存資料是根據電、磁轉換原理實現的。硬碟由一個或幾個表面鍍有磁性物質的金屬或玻璃等物質碟片以及碟片兩面所安裝的磁頭和相應的控制電路組成(圖1),其中碟片和磁頭密封在無塵的金屬殼中。
硬碟工作時,碟片以設計轉速高速旋轉,設定在碟片表面的磁頭則在電路控制下徑向移動到指定位置然後將資料存放區或讀取出來。當系統向硬碟寫入資料時,磁頭中“寫資料”電流產生磁場使碟片表面磁性物質狀態發生改變,並在寫電流磁場消失後仍能保持,這樣資料就儲存下來了;當系統從硬碟中讀資料時,磁頭經過碟片指定地區,碟片表面磁場使磁頭產生感應電流或線圈阻抗產生變化,經相關電路處理後還原成資料。因此只要能將碟片表面處理得更平滑、磁頭設計得更精密以及盡量提高碟片旋轉速度,就能造出容量更大、讀寫資料速度更快的硬碟。這是因為碟片表面處理越平、轉速越快就能越使磁頭離碟片表面越近,提高讀、寫靈敏度和速度;磁頭設計越小越精密就能使磁頭在碟片上佔用空間越小,使磁頭在一張碟片上建立更多的磁軌以儲存更多的資料。
二、硬碟的邏輯結構:
硬碟由很多碟片(platter)組成,每個碟片的每個面都有一個讀寫磁頭。如果有N個碟片。就有2N個面,對應2N個磁頭(Heads),從0、1、2開始編號。每個碟片被劃分成若干個同心圓磁軌(邏輯上的,是不可見的。)每個碟片的劃分規則通常是一樣的。這樣每個碟片的半徑均為固定值R的同心圓再邏輯上形成了一個以電機主軸為軸的柱面(Cylinders),從外至裡編號為0、1、2……每個碟片上的每個磁軌又被劃分為幾十個扇區(Sector),通常的容量是512byte,並按照一定規則編號為1、2、3……形成Cylinders×Heads×Sector個扇區。這三個參數即是硬碟的物理參數。我們下面的很多實踐需要深刻理解這三個參數的意義。
硬碟儲存資料是根據電、磁轉換原理實現的。硬碟由一個或幾個表面鍍有磁性物質的金屬或玻璃等物質碟片以及碟片兩面所安裝的磁頭和相應的控制電路組成(圖1),其中碟片和磁頭密封在無塵的金屬殼中。
三、磁碟引導原理:
3.1 MBR(master boot record)扇區:
電腦在按下power鍵以後,開始執行主板bios程式。進行完一系列檢測和配置以後。開始按bios中設定的系統引導順序引導系統。假定現在是硬碟。Bios執行完自己的程式後如何把執行權交給硬碟呢。交給硬碟後又執行儲存在哪裡的程式呢。其實,稱為mbr的一段代碼起著舉足輕重的作用。MBR(master boot record),即主引導記錄,有時也稱主開機磁區。位於整個硬碟的0柱面0磁頭1扇區(可以看作是硬碟的第一個扇區),bios在執行自己固有的程式以後就會jump到mbr中的第一條指令。將系統的控制權交由mbr來執行。在總共512byte的主引導記錄中,MBR的引導程式佔了其中的前446個位元組(位移0H~位移1BDH),隨後的64個位元組(位移1BEH~位移1FDH)為DPT(Disk
PartitionTable,硬碟分區表),最後的兩個位元組“55 AA”(位移1FEH~位移1FFH)是分區有效結束標誌。
MBR不隨作業系統的不同而不同,意即不同的作業系統可能會存在相同的MBR,即使不同,MBR也不會夾帶作業系統的性質。具有公用引導的特性。
我們來分析一段mbr。下面是用winhex查看的一塊希捷120GB硬碟的mbr。
MBR扇區代碼
你的硬碟的MBR引導代碼可能並非這樣。不過即使不同,所執行的功能大體是一樣的。這裡找wowocock關於磁碟mbr的反編譯,已加了詳細的注釋,感興趣可以細細研究一下。
我們看DPT部分。作業系統為了便於使用者對磁碟的管理。加入了磁碟分割的概念。即將一塊磁碟邏輯劃分為幾塊。磁碟分割數目的多少只受限於C~Z的英文字母的數目,在DPT共64個位元組中如何表示多個分區的屬性呢?microsoft通過連結的方法解決了這個問題。在DPT共64個位元組中,以16個位元組為分區表項單位描述一個分區的屬性。也就是說,第一個分區表項描述一個分區的屬性,一般為基本分區。第二個分區表項描述除基本分區外的其餘空間,一般而言,就是我們所說的擴充分區。這部分的大體說明見表1。
DPT程式碼分析
註:上表中的超過1位元組的資料都以實際資料顯示,就是按高位到地位的方式顯示。儲存時是按低位到高位儲存的。兩者表現不同,請仔細看清楚。以後出現的表,圖均同。
也可以在winhex中看到這些參數的意義:
說明: 每個分區表項佔用16個位元組,假定位移地址從0開始。3的分區表項3。分區表項4同分區表項3。
1、0H位移為使用中的磁碟分割是否標誌,只能選00H和80H。80H為活動,00H為非活動。其餘值對microsoft而言為非法值。
2、重新說明一下(這個非常重要):大於1個位元組的數被以低位元組在前的儲存格式格式(little endian format)或稱反位元組順序儲存下來。低位元組在前的格式是一種儲存數的方法,這樣,最低位的位元組最先出現在十六進位數符號中。例如,相對扇區數欄位的值0x3F000000的低位元組在前表示為0x0000003F。這個低位元組在前的格式數的十進位數為63。
3、系統在分區時,各分區都不允許跨柱面,即均以柱面為單位,這就是通常所說的分區粒度。有時候我們分區是輸入分區的大小為7000M,分出來卻是6997M,就是這個原因。 位移2H和位移6H的扇區和柱面參數中,扇區佔6位(bit),柱面佔10位(bit),以位移6H為例,其低6位用作扇區數的二進位表示。其高兩位做柱面數10位中的高兩位,位移7H組成的8位做柱面數10位中的低8位。由此可知,實際上用這種方式表示的分區容量是有限的,柱面和磁頭從0開始編號,扇區從1開始編號,所以最多隻能表示1024個柱面×63個扇區×256個磁頭×512byte=8455716864byte。即通常的8.4GB(實際上應該是7.8GB左右)限制。實際上磁頭數通常只用到255個(由組合語言的定址寄存器決定),即使把這3個位元組按線性定址,依然力不從心。
在後來的作業系統中,超過8.4GB的分區其實已經不通過C/H/S的方式定址了。而是通過位移CH~位移FH共4個位元組32位線性扇區地址來表示分區所佔用的扇區總數。可知通過4個位元組可以表示2^32個扇區,即2TB=2048GB,目前對於大多數電腦而言,這已經是個天文數字了。在未超過8.4GB的分區上,C/H/S的表示方法和線性扇區的表示方法所表示的分區大小是一致的。也就是說,兩種表示方法是協調的。即使不協調,也以線性定址為準。(可能在某些系統中會提示出錯)。超過8.4GB的分區結束C/H/S一般填充為FEH
FFH FFH。即C/H/S所能表示的最大值。有時候也會用柱面對1024的模來填充。不過這幾個位元組是什麼其實都無關緊要了。
雖然現在的系統均採用線性定址的方式來處理分區的大小。但不可跨柱面的原則依然沒變。本分區的扇區總數加上與前一分區之間的保留扇區數目依然必須是柱面容量的整數倍。(保留扇區中的第一個扇區就是存放分區表的MBR或虛擬MBR的扇區,分區的扇區總數線上性表示方式上是不計入保留扇區的。如果是第一個分區,保留扇區是本分區前的所有扇區。
附:分區表類型標誌4
3.2 擴充分區
擴充分區中的每個邏輯磁碟機都存在一個類似於MBR的擴充引導記錄( Extended Boot Record, EBR),也有人稱之為虛擬mbr或擴充mbr,意思是一樣的。擴充引導記錄包括一個擴充分區表和該扇區的標籤。擴充引導記錄將記錄只包含擴充分區中每個邏輯磁碟機的第一個柱面的第一面的資訊。一個邏輯磁碟機中的開機磁區一般位於相對扇區32或63。但是,如果磁碟上沒有擴充分區,那麼就不會有擴充引導記錄和邏輯磁碟機。第一個邏輯磁碟機的擴充分區表中的第一項指向它自身的開機磁區。第二項指向下一個邏輯磁碟機的EBR。如果不存在進一步的邏輯磁碟機,第二項就不會使用,而且被記錄成一系列零。如果有附加的邏輯磁碟機,那麼第二個邏輯磁碟機的擴充分區表的第一項會指向它本身的開機磁區。第二個邏輯磁碟機的擴充分區表的第二項指向下一個邏輯磁碟機的EBR。擴充分區表的第三項和第四項永遠都不會被使用。
通過一幅4分區的磁碟結構圖可以看到磁碟的大致組織形式。5
關於擴充分區,6所示,擴充分區中邏輯磁碟機的擴充引導記錄是一個串連表。該圖顯示了一個擴充分區上的三個邏輯磁碟機,說明了前面的邏輯磁碟機和最後一個邏輯磁碟機之間在擴充分區表中的差異。
除了擴充分區上最後一個邏輯磁碟機外,表2中所描述的擴充分區表的格式在每個邏輯磁碟機中都是重複的:第一個項標識了邏輯磁碟機本身的開機磁區,第二個項標識了下一個邏輯磁碟機的EBR。最後一個邏輯磁碟機的擴充分區表只會列出它本身的分區項。最後一個擴充分區表的第二個項到第四個項被使用。
擴充分區表項中的相對扇區數欄位所顯示的是從擴充分區開始到邏輯磁碟機中第一個扇區的位移的位元組數。總扇區數欄位中的數是指組成該邏輯磁碟機的扇區數目。總扇區數欄位的值等於從擴充分區表項所定義的開機磁區到邏輯磁碟機末尾的扇區數。
有時候在磁碟的末尾會有剩餘空間,剩餘空間是什麼呢?我們前面說到,分區是以1柱面的容量為分區粒度的,那麼如果磁碟總空間不是整數個柱面的話,不夠一個柱面的剩下的空間就是剩餘空間了,這部分空間並不參與分區,所以一般無法利用。照道理說,磁碟的物理模式決定了磁碟的總容量就應該是整數個柱面的容量,為什麼會有不夠一個柱面的空間呢。在我的理解看來,本來現在的磁碟為了更大的利用空間,一般在物理上並不是按照外圍的扇區大於裡圈的扇區這種管理方式,只是為了與作業系統相容而抽象出來CHS。可能其實際空間容量不一定正好為整數個柱面的容量。