SQL Server中暫存資料表與表變數的區別

來源:互聯網
上載者:User

 

我們在資料庫中使用表的時候,經常會遇到兩種使用表的方法,分別就是使用暫存資料表及表變數。在實際使用的時候,我們如何靈活的在預存程序中運用它們,雖然它們實現的功能基本上是一樣的,可如何在一個預存程序中有時候去使用暫存資料表而不使用表變數,有時候去使用表變數而不使用暫存資料表呢?

  暫存資料表

  暫存資料表與永久表相似,只是它的建立是在Tempdb中,它只有在一個資料庫連接結束後或者由SQL命令DROP掉,才會消失,否則就會一直存在。暫存資料表在建立的時候都會產生SQL Server的系統日誌,雖它們在Tempdb中體現,是分配在記憶體中的,它們也支援物理的磁碟,但使用者在指定的磁碟裡看不到檔案。

  暫存資料表分為本地和全域兩種,本地暫存資料表的名稱都是以“#”為首碼,只有在本地當前的使用者串連中才是可見的,當使用者從執行個體中斷連線時被刪除。全域暫存資料表的名稱都是以“##”為首碼,建立後對任何使用者都是可見的,當所有引用該表的使用者中斷連線時被刪除。

  下面我們來看一個建立暫存資料表的例子:  

       CREATE TABLE dbo.#News
  (
  News_id int NOT NULL,
  NewsTitle varchar(100),
  NewsContent varchar(2000),
  NewsDateTime datetime
  )

  暫存資料表可以建立索引,也可以定義統計資料,所以可以用資料定義語言 (Data Definition Language)(DDL)的聲明來阻止暫存資料表添加的限制,約束,並參照完整性,如主鍵和外鍵約束。比如來說,我們現在來為#News表欄位NewsDateTime來添加一個預設的GetData()當前日期值,並且為News_id添加一個主鍵,我們就可以使用下面的語句: 

      ALTER TABLE dbo.#News
  ADD
  CONSTRAINT [DF_NewsDateTime] DEFAULT (GETDATE()) FOR [NewsDateTime],
  PRIMARY KEY CLUSTERED
  (
  [News_id]
  ) ON [PRIMARY]
  GO

  暫存資料表在建立之後可以修改許多已定義的選項,包括:

  1)添加、修改、刪除列。例如,列的名稱、長度、資料類型、精度、小數位元以及為空白性均可進行修改,只是有一些限制而已。

  2)可添加或刪除主鍵和外鍵約束。

  3)可添加或刪除 UNIQUE 和 CHECK 條件約束及 DEFAULT 定義(對象)。

  4)可使用 IDENTITY 或 ROWGUIDCOL 屬性添加或刪除標識符列。雖然 ROWGUIDCOL 屬性也可添加至現有列或從現有列刪除,但是任何時候在表中只能有一列可具有該屬性

5)表及表中所選定的列登入為全文索引。

  表變數

  表變數建立的文法類似於暫存資料表,區別就在於建立的時候,必須要為之命名。表變數是變數的一種,表變數也分為本地及全域的兩種,本地表變數的名稱都是以“@”為首碼,只有在本地當前的使用者串連中才可以訪問。全域的表變數的名稱都是以“@@”為首碼,一般都是系統的全域變數,像我們常用到的,如@@Error代表錯誤的號,@@RowCount代表影響的行數。

  如我們看看建立表變數的語句:

     DECLARE @News Table
  (
  News_id int NOT NULL,
  NewsTitle varchar(100),
  NewsContent varchar(2000),
  NewsDateTime datetime
  )

  比較暫存資料表及表變數都可以通過SQL的選擇、插入、更新及刪除語句,它們的的不同主要體現在以下這些:

  1)表變數是儲存在記憶體中的,當使用者在訪問表變數的時候,SQL Server是不產生日誌的,而在暫存資料表中是產生日誌的;

  2)在表變數中,是不允許有非叢集索引的;

  3)表變數是不允許有DEFAULT預設值,也不允許有約束;

  4)暫存資料表上的統計資訊是健全而可靠的,但是表變數上的統計資訊是不可靠的;

  5)暫存資料表中是有鎖的機制,而表變數中就沒有鎖的機制。

  我們現在來看一個完整的例子,來看它們的用法的異同:

  利用暫存資料表  

       CREATE TABLE dbo.#News
  (
  News_id int NOT NULL,
  NewsTitle varchar(100),
  NewsContent varchar(2000),
  NewsDateTime datetime
  )
  INSERT INTO dbo.#News (News_id, NewsTitle, NewsContent, NewsDateTime)
  VALUES (1,'BlueGreen', 'Austen', 200801, GETDATE())
  SELECT News_id, NewsTitle, NewsContent, NewsDateTime FROM dbo.#News
  DROP TABLE dbo.[#News]

  利用表變數      

      DECLARE @News table
  (
  News_id int NOT NULL,
  NewsTitle varchar(100),
  NewsContent varchar(2000),
  NewsDateTime datetime
  )
  INSERT INTO @News (News_id, NewsTitle, NewsContent, NewsDateTime)
  VALUES (1,'BlueGreen', 'Austen', 200801, GETDATE())
  SELECT News_id, NewsTitle, NewsContent, NewsDateTime FROM @News

  我們可以看到上面兩種情況實現的是一樣的效果,第一種利用暫存資料表的時候,暫存資料表一般被建立後,如果在執行的時候,沒有通過DROP Table的操作,第二次就不能再被建立,而定義表變數也不需要進行DROP Table的操作,一次執行完成後就會消失。

  其實在選擇暫存資料表還是表變數的時候,我們大多數情況下在使用的時候都是可以的,但一般我們需要遵循下面這個情況,選擇對應的方式:

  1)使用表變數主要需要考慮的就是應用程式對記憶體的壓力,如果代碼的運行執行個體很多,就要特別注意記憶體變數對記憶體的消耗。我們對於較小的資料或者是通過計算出來的推薦使用表變數。如果資料的結果比較大,在代碼中用於臨時計算,在選取的時候沒有什麼分組的彙總,就可以考慮使用表變數。

  2)一般對於大的資料結果,或者因為統計出來的資料為了便於更好的最佳化,我們就推薦使用暫存資料表,同時還可以建立索引,由於暫存資料表是存放在Tempdb中,一般預設分配的空間很少,需要對tempdb進行調優,增大其儲存的空間。

補充:
     

在暫存資料表

create table #T (…)

和表變數

declare @T table (…)

之間主要有3個理論上的不同。

 

第一個不同使交易記錄不會記錄表變數。因此,它們脫離了事務機制的範圍,從下面的例子可顯而易見:

 

create table #T (s varchar(128))

declare @T table (s varchar(128))

insert into #T select 'old value #'

insert into @T select 'old value @'

begin transaction

    update #T set s='new value #'

    update @T set s='new value @'

rollback transaction

select * from #T

select * from @T

 

s

---------------

old value #

 

s

---------------

new value @

 

在聲明暫存資料表#T和表變數@T之後,給它們分配一個相同的值為old value字串。然後,開始一個事務去更新它們。此時,它們都將有新的相同的值new value字串。但當交易回復時,正如你所看到的,表變數@T保留了這個新值而沒有返回old value字串。這是因為即使表變數在事務內被更新了,它本身不是事務的一部分。

 

第二個主要的不同是任何一個使用暫存資料表的預存程序都不會被先行編譯,然而使用表變數的預存程序的執行計畫可以預先靜態編譯。先行編譯一個指令碼的主要好處在於加快了執行的速度。這個好處對於長的預存程序更加顯著,因為對它來說重新編譯代價太高。

 

最後,表變數僅存在於那些變數能存在的相同範圍內。和暫存資料表相反,它們在內部預存程序和exec(string)語句裡是不可見的。它們也不能在insert/exec語句裡使用。

 

 

 

表變數 vs. 暫存資料表

  表變數 暫存資料表
資料集的儲存位置 記憶體(不考慮被換到分頁檔這種情況) 磁碟(不考慮訪問後被緩衝到記憶體中)
是否需要日誌
是否可以建立索引
是否可以使用統計資料
是否可以在多會話中訪問
是否需要鎖機制
 結論

綜上所述,大家會發現暫存資料表和表變數在底層處理機制上是有很多差別的。

簡單地總結,我們對於較小的臨時計算用資料集推薦使用表變數。如果資料集比較大,如果在代碼中用於臨時計算,同時這種臨時使用永遠都是簡單的全資料集掃描而不需要考慮什麼最佳化,比如說沒有分組或分組很少的彙總(比如說COUNT、SUM、AVERAGE、MAX等),也可以考慮使用表變數。使用表變數另外一個考慮因素是應用環境的記憶體壓力,如果代碼的運行執行個體很多,就要特別注意記憶體變數對記憶體的消耗。

一般對於大的資料集我們推薦使用暫存資料表,同時建立索引,或者通過SQL Server的統計資料(Statisitcs)自動建立和維護功能來提供訪問SQL語句的最佳化。如果需要在多個使用者會話間交換資料,當然暫存資料表就是唯一的選擇了。需要提及的是,由於暫存資料表存放在tempdb中,因此要注意tempdb的調優。

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.