標籤:blog http 使用 io strong 檔案 資料 for
如果你的資料庫中某一個表中的資料滿足以下幾個條件,那麼你就要考慮建立分區表了。
1、資料庫中某個表中的資料很多。很多是什麼概念?一萬條?兩萬條?還是十萬條、一百萬條?這個,我覺得是仁者見仁、智者見智的問題。當然資料表中的資料多到查詢時明顯感覺到資料很慢了,那麼,你就可以考慮使用分區表了。如果非要我說一個數值的話,我認為是100萬條。
2、但是,資料多了並不是建立分區表的惟一條件,哪怕你有一千萬條記錄,但是這一千萬條記錄都是常用的記錄,那麼最好也不要使用分區表,說不定會得不償失。只有你的資料是分段的資料,那麼才要考慮到是否需要使用分區表。
3、什麼叫資料是分段的?這個說法雖然很不專業,但很好理解。比如說,你的資料是以年為分隔的,對於今年的資料而言,你常進行的操作是添加、修改、刪除和查詢,而對於往年的資料而言,你幾乎不需要操作,或者你的操作往往只限於查詢,那麼恭喜你,你可以使用分區表。換名話說,你對資料的操作往往只涉及到一部分資料而不是所有資料的話,那麼你就可以考慮什麼分區表了。
那麼,什麼是分區表呢?
簡單一點說,分區表就是將一個大表分成若干個小表。假設,你有一個銷售記錄表,記錄著每個每個商場的銷售情況,那麼你就可以把這個銷售記錄表按時間分成幾個小表,例如說5個小表吧。2009年以前的記錄使用一個表,2010年的記錄使用一個表,2011年的記錄使用一個表,2012年的記錄使用一個表,2012年以後的記錄使用一個表。那麼,你想查詢哪個年份的記錄,就可以去相對應的表裡查詢,由於每個表中的記錄數少了,查詢起來時間自然也會減少。
但將一個大表分成幾個小表的處理方式,會給程式員增加編程上的難度。以添加記錄為例,以上5個表是獨立的5個表,在不同時間添加記錄的時候,程式員要使用不同的SQL語句,例如在2011年添加記錄時,程式員要將記錄添加到2011年那個表裡;在2012年添加記錄時,程式員要將記錄添加到2012年的那個表裡。這樣,程式員的工作量會增加,出錯的可能性也會增加。
使用分區表就可以很好的解決以上問題。分區表可以從物理上將一個大表分成幾個小表,但是從邏輯上來看,還是一個大表。
接著上面的例子,分區表可以將一個銷售記錄表分成五個物理上的小表,但是對於程式員而言,他所面對的依然是一個大表,無論是2010年添加記錄還是2012年添加記錄,對於程式員而言是不需要考慮的,他只要將記錄插入到銷售記錄表——這個邏輯中的大表裡就行了。SQL Server會自動地將它放在它應該呆在的那個物理上的小表裡。
同樣,對於查詢而言,程式員也只需要設定好查詢條件,OK,SQL Server會自動將去相應的表裡查詢,不用管太多事了。
這一切是不是很誘人?
的確,那麼我們就可以開始動手建立分區表了。
第一、建立分區表的第一步,先建立資料庫檔案組,但這一步可以省略,因為你可以直接使用PRIMARY檔案。但我個人認為,為了方便管理,還是可以先建立幾個檔案組,這樣可以將不同的小表放在不同的檔案組裡,既便於理解又可以提高運行速度。建立檔案組的方法很簡單,開啟SQL Server Management Studio,找到分區表所在資料庫,按右鍵,在彈出的菜單裡選擇“屬性”。然後選擇“檔案組”選項,再單擊下面的“添加”按鈕,如所示:
第二,建立了檔案組之後,還要再建立幾個資料庫檔案。為什麼要建立資料庫檔案,這很好理解,因為分區的小表必須要放在硬碟上,而放在硬碟上的什麼地方呢?當然是檔案裡啦。再說了,檔案組中沒有檔案,檔案組還要來有啥用呢?還是在的那個介面,選擇“檔案”選項,然後添加幾個檔案。在添加檔案的時候要注意以下幾點:
1、不要忘記將不同的檔案放在檔案組中。當然一個檔案組中也可以包含多個不同的檔案。
2、如果可以的話,將不同的檔案放在不同的硬碟分區裡,最好是放在不同的獨立硬碟裡。要知道IQ的速度往往是影響SQL Server運行速度的重要條件之一。將不同的檔案放在不同的硬碟上,可以加快SQL Server的運行速度。
在本例中,為了方便起見,將所有資料庫檔案都放在了同一個硬碟下,並且每個檔案組中只有一個檔案。如所示。
第三、建立一個分區函數。這一步是必須的了,建立分區函數的目的是告訴SQL Server以什麼方式對分區表進行分區。這一步必須要什麼SQL指令碼來完成。以上面的例子,我們要將銷售表按時間分成5個小表。假設劃分的時間為:
第1個小表:2010-1-1以前的資料(不包含2010-1-1)。
第2個小表:2010-1-1(包含2010-1-1)到2010-12-31之間的資料。
第3個小表:2011-1-1(包含2011-1-1)到2011-12-31之間的資料。
第4個小表:2012-1-1(包含2012-1-1)到2012-12-31之間的資料。
第5個小表:2013-1-1(包含2013-1-1)之後的資料。
那麼分區函數的代碼如下所示:
[c-sharp] view plaincopy
- CREATE PARTITION FUNCTION partfunSale (datetime)
- AS RANGE RIGHT FOR VALUES (‘20100101‘,‘20110101‘,‘20120101‘,‘20130101‘)
其中:
1、CREATE PARTITION FUNCTION意思是建立一個分區函數。
2、partfunSale為分區函數名稱。
3、AS RANGE RIGHT為設定分區範圍的方式為Right,也就是右置方式。
4、FOR VALUES (‘20100101‘,‘20110101‘,‘20120101‘,‘20130101‘)為按這幾個值來分區。
這裡需要說明的一下,在Values中,‘20100101‘、‘20110101‘、‘20120101‘、‘20130101‘,這些都是分區的條件。“ 20100101”代表2010年1月1日,在小於這個值的記錄,都會分成一個小表中,如表1;而小於或等於‘20100101‘並且小於‘20110101‘的值,會放在另一個表中,如表2。以此類推,到最後,所有大小或等於‘20130101‘的值會放在另一個表中,如表5。
也許有人會問,為什麼值“ 20100101”會放在表2中,而不是表1中呢?這是由AS RANGE RIGHT中的RIGHT所決定的,RIGHT的意思是將等於這個值的資料放在右邊的那個表裡,也就是表2中。如果您的SQL語句中使用的是Left而不是RIGHT,那麼就會放在左邊的表中,也就是表1中。
第四、建立一個資料分割配置。資料分割配置的作用是將分區函數產生的分區映射到檔案組中去。分區函數的作用是告訴SQL Server,如何將資料進行分區,而資料分割配置的作用則是告訴SQL Server將已分區的資料放在哪個檔案組中。資料分割配置的代碼如下所示:
[c-sharp] view plaincopy
- CREATE PARTITION SCHEME partschSale
- AS PARTITION partfunSale
- TO (
- Sale2009,
- Sale2010,
- Sale2011,
- Sale2012,
- Sale2013)
其中:
1、CREATE PARTITION SCHEME意思是建立一個資料分割配置。
2、partschSale為資料分割配置名稱。
3、AS PARTITION partfunSale說明該資料分割配置所使用的資料劃分條件(也就是所使用的分區函數)為partfunSale。
4、TO後面的內容是指partfunSale分區函數劃分出來的資料對應存放的檔案組。
到此為止,分區函數和資料分割配置就建立完畢了。建立後的分區函數和資料分割配置在資料庫的“儲存”中可以看到,如所示:
最後,建立分區表,建立方式和建立普遍表類似,如下所示:
[c-sharp] view plaincopy
- CREATE TABLE Sale(
- [Id] [int] IDENTITY(1,1) NOT NULL,
- [Name] [varchar](16) NOT NULL,
- [SaleTime][datetime] NOT NULL
- ) ON partschSale([SaleTime])
其中:
1、CREATE TABLE 意思是建立一個資料表。
2、Sale為資料表名。
3、()中為表中的欄位,這裡的內容和建立普通資料表沒有什麼區別,惟一需要注意的是不能再建立叢集索引了。道理很簡單,叢集索引可以將記錄在物理上順序儲存的,而分區表是將資料分別儲存在不同的表中,這兩個概念是衝突的,所以,在建立分區表的時候就不能再建立叢集索引了。
4、ON partschSale()說明使用名為partschSale的資料分割配置。
5、partschSale()括弧中為用於分區條件的欄位是SaleTime。
OK,一個物理上是分離的,邏輯上是一體的分區表就建立完畢了。查看該表的屬性,可以看到該表已經屬於分區表了。
原創不容易,轉載請註明出處。http://blog.csdn.net/smallfools/archive/2009/12/03/4930810.aspx