標籤:sql 不同 很多 time() data arc 普通表 增刪改 表達
1. 分區表簡介
分區表在邏輯上是一個表,而物理上是多個表。從使用者角度來看,分區表和普通表是一樣的。使用分區表的主要目的是為改善大型表以及具有多個訪問模式的表的延展性和可管理性。
分區表是把資料按設定的標準劃分成地區儲存在不同的檔案組中,使用分區可以快速而有效管理和訪問資料子集。
1.1> 適合做分區表的情況
? 資料庫中某個表的資料很多,在查詢資料時會明顯感覺到速度很慢,這個時候需要考慮分區表;
? 資料是分段的,如以年份為分隔的資料,對於當年的資料經常進行增刪改查操作,而對於往年的資料幾乎不做操作或只做查詢操作,這種情況可以使用分區表。對資料的操作如果只涉及一部分資料而不是全部資料的情況可以考慮分區表,如果一張表的資料經常使用且不管年份之類的因素經常對其增刪改查操作則最好不要分區。
1.2> 分區表的優點
? 分區表可以從物理上將一個大表分成幾個小表,但是從邏輯上來看還是一個大表。
? 對於具有多個CPU的系統,分區可以對錶的操作通過並行的方式進行,可以提升訪問效能。
2. 建立分區表步驟
建立分區表的步驟分為5步:
(1)建立資料庫檔案組
(2)建立資料庫檔案
(3)建立分區函數
(4)建立資料分割配置
(5)建立分區表
2.1> 建立資料庫檔案組
建立樣本資料庫Northwind,建立資料庫檔案組和檔案,添加檔案組。
2.2> 建立資料庫檔案
建立資料檔案,並為資料檔案分配檔案組。
完成建立後的資料庫檔案資訊
通過SQL Server Profiler可以看到具體的建立資料庫的指令碼如下:
CREATE DATABASE [Northwind] CONTAINMENT = NONE ON PRIMARY ( NAME = N‘Northwind‘, FILENAME = N‘F:\Database\Northwind\Northwind.mdf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ), FILEGROUP [SECTION2010] ( NAME = N‘Northwind_Data_2010‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2010.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ), FILEGROUP [SECTION2011] ( NAME = N‘Northwind_Data_2011‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2011.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ), FILEGROUP [SECTION2012] ( NAME = N‘Northwind_Data_2012‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2012.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ), FILEGROUP [SECTION2013] ( NAME = N‘Northwind_Data_2013‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2013.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ), FILEGROUP [SECTION2014] ( NAME = N‘Northwind_Data_2014‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2014.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ) LOG ON ( NAME = N‘Northwind_log‘, FILENAME = N‘F:\Database\Northwind\Northwind_log.ldf‘ , SIZE = 2048KB , FILEGROWTH = 10%)
查看資料庫檔案組SQL語句:
2.3> 建立分區函數
建立分區函數Transact-SQL文法:
CREATE PARTITION FUNCTION partition_function_name ( input_parameter_type )AS RANGE [ LEFT | RIGHT ] FOR VALUES ( [ boundary_value [ ,...n ] ] ) [ ; ]
參數:
partition_function_name:分區函數的名稱。 分區函數名稱在資料庫內必須唯一,並且符合標識符的規則。
input_parameter_type:用於分區的列的資料類型。 當用作分區列時,除 text、ntext、image、xml、timestamp、varchar(max)、nvarchar(max)、varbinary(max)、別名資料類型或 CLR 使用者定義資料類型外,所有資料類型均有效。
boundary_value:為使用 partition_function_name 的資料分割資料表或索引的每個分區指定邊界值。 如果 boundary_value 為空白,則分區函數使 partition_function_name 將整個表或索引映射到單個分區。 只能使用 CREATE TABLE 或 CREATE INDEX 語句中指定的一個分區列。
LEFT | RIGHT 指定當間隔值由 資料庫引擎 按升序從左至右排序時,boundary_value [ ,...n ] 屬於每個邊界值間隔的哪一側(左側還是右側)。 如果未指定,則預設值為 LEFT。
樣本:建立將用於Order表的分區函數
CREATE PARTITION FUNCTION Function_DateTime ( DATETIME )AS RANGE RIGHTFOR VALUES(‘2011-01-01‘, ‘2012-01-01‘, ‘2013-01-01‘, ‘2014-01-01‘)
完成建立分區函數之後,可以通過以下SQL語句查看已建立的分區函數情況。
SELECT * FROM sys.partition_functions
2.4> 建立資料分割配置
資料分割配置的作用是將分區函數產生的分區映射到檔案組中去,資料分割配置是讓SQL Server將已分區的資料放在哪個檔案組中。
在當前資料庫中建立一個將資料分割資料表或資料分割索引的分區映射到檔案組的方案。 資料分割資料表或資料分割索引的分區的個數和域在分區函數中確定。 必須首先在 CREATE PARTITION FUNCTION 語句中建立分區函數,然後才能建立資料分割配置。
建立資料分割配置的Transact-SQL文法:
CREATE PARTITION SCHEME partition_scheme_nameAS PARTITION partition_function_name[ ALL ] TO ( { file_group_name | [ PRIMARY ] } [ ,...n ] )[ ; ]
參數:
partition_scheme_name:資料分割配置的名稱。 資料分割配置名稱在資料庫中必須是唯一的,並且符合標識符規則。
partition_function_name:使用資料分割配置的分區函數的名稱。 分區函數所建立的分區將映射到在資料分割配置中指定的檔案組。 partition_function_name 必須已經存在於資料庫中。 單個分區不能同時包含 FILESTREAM 和非 FILESTREAM 檔案組。
ALL:指定所有分區都映射到在 file_group_name 中提供的檔案組,或映射到主檔案組(如果指定了 [PRIMARY]。 如果指定了 ALL,則只能指定一個 file_group_name。
file_group_name | [ PRIMARY ] [ ,...n]:指定用來持有由 partition_function_name 指定的分區的檔案組的名稱。 file_group_name 必須已經存在於資料庫中。
如果指定了 [PRIMARY],則分區將儲存於主檔案組中。 如果指定了 ALL,則只能指定一個 file_group_name。 分區分配到檔案組的順序是從分區 1 開始,按檔案組在 [,...n] 中列出的順序進行分配。 在 [,...n] 中,可以多次指定同一個 file_group_name。 如果 n 不足以擁有在 partition_function_name 中指定的分區數,則 CREATE PARTITION SCHEME 將失敗,並返回錯誤。
如果 partition_function_name 產生的分區數少於檔案組數,則第一個未分配的檔案組將標記為 NEXT USED,並且出現顯示命名 NEXT USED 檔案組的資訊。 如果指定了 ALL,則單獨的 file_group_name 將為該 partition_function_name 保持它的 NEXT USED 屬性。 如果在 ALTER PARTITION FUNCTION 語句中建立了一個分區,則 NEXT USED 檔案組將再接收一個分區。 若要再建立一個未分配的檔案組來擁有新的分區,請使用 ALTER PARTITION SCHEME。
在 file_group_name[ 1,...n] 中指定主檔案組時,必須像在 [PRIMARY] 中那樣分隔 PRIMARY,因為它是關鍵字。
樣本:建立將用於Order表的資料分割配置
CREATE PARTITION SCHEME Scheme_DateTimeAS PARTITION Function_DateTimeTO ( SECTION2010, SECTION2011, SECTION2012, SECTION2013, SECTION2014 )
分區函數和資料分割配置建立之後,可以在資料庫的【儲存】中查看:
通過可以通過以下SQL語句查看已建立的資料分割配置:
SELECT * FROM sys.partition_schemes
2.5> 建立分區表
CREATE TABLE [Order]( OrderID INT IDENTITY(1,1) NOT NULL, UserID INT NOT NULL, TotalAmount DECIMAL(18,2) NULL, OrderDate DATETIME NOT NULL) ON Scheme_DateTime ( OrderDate )
這裡需要注意分區表不能再建立叢集索引,因為叢集索引可以將記錄在物理上順序儲存,而分區表是將資料存放區在不同的表中,這兩個概念是衝突的,所以在建立分區表時不能再建立叢集索引。
完成Order表建立之後,查看錶的屬性,可以看到Order表已經是分區表。
3. 操作分區表
3.1> Insert資料
USE [Northwind]GOINSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (1 ,10.00 ,‘2009-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (1 ,20.50 ,‘2009-12-31‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (2 ,40.00 ,‘2010-01-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (3 ,40.00 ,‘2010-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (4 ,50.00 ,‘2011-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (5 ,60.00 ,‘2012-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (5 ,60.00 ,‘2012-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (6 ,70.00 ,‘2013-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (10 ,90.00 ,‘2014-10-20‘);INSERT INTO [dbo].[Order] ([UserID],[TotalAmount] ,[OrderDate]) VALUES (9 ,100.00 ,‘2015-10-20‘);GO
3.2> 查詢資料所在物理分區表
在分區表中使用一般的SELECT語句無法知道資料是分別存放在哪幾個不同的物理表中,若要知道資料分別存放的物理表,可以使用$PARTITION函數,該函數可以調用分區函數並返回資料所在物理分區的編號。
$PARTITION的文法:$PARTITION.分區函數名(運算式)
SELECT $PARTITION.Function_DateTime(‘2010-01-01‘)
查詢結果分區函數返回為1,說明2010-01-01的資料會存放在第1個物理分區表中。
使用$PARTITION函數可以具體知道每個物理分區表中存放了哪些記錄。
查看物理分區表中存放的記錄:
SELECT * FROM [Order] WHERE $PARTITION.Function_DateTime(OrderDate) = 1
SELECT $PARTITION.Function_DateTime(OrderDate) AS 分區編號, COUNT(1) AS 記錄數 FROM [Order]GROUP BY $PARTITION.Function_DateTime(OrderDate)
3.3> 修改分區表資料
UPDATE dbo.[Order] SET OrderDate=‘2015-01-01‘ WHERE OrderID = 3
4. 將普通錶轉換為分區表
一般的普通表都是在主鍵上建叢集索引,記錄的物理儲存位置由主鍵決定。
樣本:建立一個Product普通表
CREATE TABLE Product( ProductID INT IDENTITY(1,1) NOT NULL, ProductName VARCHAR(100) NOT NULL, UnitPrice DECIMAL(18,2) NULL, CreateDate DATETIME NOT NULL, CONSTRAINT PK_Product PRIMARY KEY CLUSTERED (ProductID))
USE [Northwind]GOINSERT INTO [dbo].[Product] ([ProductName],[UnitPrice],[CreateDate]) VALUES (‘LINQ to SQL‘ ,10 ,‘2012-01-01‘);INSERT INTO [dbo].[Product] ([ProductName],[UnitPrice],[CreateDate]) VALUES (‘LINQ to XML‘ ,10 ,‘2012-12-01‘);INSERT INTO [dbo].[Product] ([ProductName],[UnitPrice],[CreateDate]) VALUES (‘LINQ to Object‘ ,10 ,‘2013-02-01‘);INSERT INTO [dbo].[Product] ([ProductName],[UnitPrice],[CreateDate]) VALUES (‘LINQ to ADO.NET‘ ,10 ,‘2014-01-02‘);INSERT INTO [dbo].[Product] ([ProductName],[UnitPrice],[CreateDate]) VALUES (‘LINQ to Entity‘ ,10 ,‘2015-01-01‘);GO
查看錶Product的屬性:
查看錶Product的索引,可以看到PK_Product為叢集索引。
將普通錶轉換為分區表的操作是先在普通表上刪除叢集索引,在建立一個新的叢集索引,在該叢集索引中使用資料分割配置。
在SQL Server中,主鍵欄位上預設建立叢集索引,刪除主鍵的叢集索引。
ALTER TABLE Product DROP CONSTRAINT PK_Product
重新建立主鍵非叢集索引
ALTER TABLE Product ADD CONSTRAINT PK_Product PRIMARY KEY NONCLUSTERED (ProductID ASC)
重新建立後的主鍵:
建立使用資料分割配置的叢集索引:
CREATE CLUSTERED INDEX IX_CreateDate ON Product ( CreateDate )ON Scheme_DateTime ( CreateDate )
調整後的Product表屬性:
調整後Product表記錄的物理儲存情況:
5. 刪除(合并)一個分區表
刪除2012-01-01的分區,修改分區函數:
ALTER PARTITION FUNCTION Function_DateTime() MERGE RANGE (‘2012-01-01‘)
在修改了分區函數之後,與之關聯的資料分割配置也將同時自動調整。在執行了上面合并分區的函數之後,查看資料分割配置的Create指令碼。
CREATE PARTITION SCHEME [Scheme_DateTime] AS PARTITION [Function_DateTime] TO ([SECTION2010], [SECTION2011], [SECTION2013], [SECTION2014])
合并分區之後,被合并的分區記錄也將被重新分配物理儲存位置。
6. 添加分區
資料分割配置中指定的檔案組個數比分區函數中指定的邊界數大1,為資料分割配置指定一個可用的檔案組時,該資料分割配置並沒有立刻使用這個檔案組,只是將檔案組先備用著,等修改了分區函數之後資料分割配置才會使用這個檔案組。如果分區函數沒有更改,資料分割配置中的檔案組個數也不會更改。
添加分區所需要使用到的檔案組可以使用之前合并分區之後沒有再使用的SECTION2012,也可以建立檔案組。
ALTER DATABASE [Northwind] ADD FILEGROUP [SECTION2015]
ALTER DATABASE [Northwind] ADD FILE ( NAME = N‘Northwind_Data_2015‘, FILENAME = N‘F:\Database\Northwind\Northwind_Data_2015.ndf‘ , SIZE = 5120KB , FILEGROWTH = 1024KB ) TO FILEGROUP [SECTION2015]
為資料分割配置指定一個可用的檔案組:
ALTER PARTITION SCHEME Scheme_DateTime NEXT USED [SECTION2015]
修改分區函數,添加分區:
ALTER PARTITION FUNCTION Function_DateTime() SPLIT RANGE(‘2015-01-01‘)
查看添加分區後的資料實體儲存體:
Sql Server系列:分區表操作