在過去的十年中,Oracle已經成為世界上最專業的資料庫之一。對於IT專家來說,就是要確保利用Oracle的強大特性來提高他們公司的生產力。最有效方法之一是通過Oracle調優。它有大量的調整參數和技術來改進你的Oracle資料庫的效能。
Oracle調優是一個複雜的主題。關於調優可以寫整整一本書,不過,為了改善Oracle資料庫的效能,有一些基本的概念是每個Oracle DBA都應該遵從的。
在這篇簡介中,我們將簡要地介紹以下的Oracle主題:
--外部調整:我們應該記住Oracle並不是單獨啟動並執行。因此我們將查看一下通過調整Oracle伺服器以得到高的效能。
--Row re-sequencing以減少磁碟I/O:我們應該懂得Oracle調優最重要的目標是減少I/O。
--Oracle SQL調整。Oracle SQL調整是Oracle調整中最重要的領域之一,只要通過一些簡單的SQL調優規則就可以大幅度地提升SQL語句的效能,這是一點都不奇怪的。
--調整Oracle排序:排序對於Oracle效能也是有很大影響的。
--調整Oracle的競爭:表和索引的參數設定對於UPDATE和INSERT的效能有很大的影響。
我們首先從調整Oracle外部的環境開始。如果記憶體和CPU的資源不足的話,任何的Oracle調整都是沒有協助的。
外部的效能問題
Oracle並不是單獨啟動並執行。Oracle資料庫的效能和外部的環境有很大的關係。這些外部的條件包括有:
.CPU--CPU資源的不足令查詢變慢。當查詢超過了Oracle伺服器的CPU效能時,你的資料庫效能就受到CPU的限制。
.記憶體--可用於Oralce的記憶體數量也會影響SQL的效能,特別是在資料緩衝和記憶體排序方面。
.網路--大量的Net8通訊令SQL的效能變慢。
許多新手都錯誤的認為應該首先調整Oracle資料庫,而不是先確認外部資源是否足夠。實際上,如果外部環境出現瓶頸,再多的Oracle調整都是沒有協助的。
在檢查Oracle的外部環境時,有兩個方面是需要注意的:
1、當運行隊列的數目超過伺服器的CPU數量時,伺服器的效能就會受到CPU的限制。補救的方法是為伺服器增加額外的CPU或者關閉需要很多處理資源的組件,例如Oracle Parallel Query。
2、記憶體分頁。當記憶體分頁時,記憶體容量已經不足,而記憶體頁是與磁碟上的交換區進行互動的。補救的方法是增加更多的記憶體,減少Oracle SGA的大小,或者關閉Oracle的多線程伺服器。
可以使用各種標準的伺服器工具來得到伺服器的統計資料,例如vmstat,glance,top和sar。DBA的目標是確保資料庫伺服器擁有足夠的CPU和記憶體資源來處理Oracle的請求。
以下讓我們來看一下Oracle的row-resequencing是如何能夠極大地減少磁碟I/O的。
Row-resequencing(行的重新排序)
就象我們上面提到的,有經驗的Oracle DBA都知道I/O是回應時間的最大組成部分。其中磁碟I/O特別厲害,因為當Oracle由磁碟上的一個資料檔案得到一個資料區塊時,讀的進程就必須等待物理I/O操作完成。磁碟操作要比資料緩衝慢10,000倍。因此,如果可以令I/O最小化,或者減少由於磁碟上的檔案競爭而帶來的瓶頸,就可以大大地改善Oracle資料庫的效能。
如果系統響應很慢,通過減少磁碟I/O就可以有一個很快的改善。如果在一個事務中通過按一定的範圍搜尋primary-key索引來訪問表,那麼重新以CTAS的方法組織表將是你減少I/O的首要策略。通過在物理上將行排序為和primary-key索引一樣的順序,就可以加快獲得資料的速度。
就象磁碟的Server Load Balancer一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的DBA管理技巧一起使用,就可以在高I/O的系統中大大地減少響應的時間。
在高容量的線上交易處理環境中(online transaction processing,OLTP),資料是由一個primary索引得到的,重新排序表格的行就可以令連續塊的順序和它們的primary索引一樣,這樣就可以在索引驅動的表格式查詢中,減少物理I/O並且改善回應時間。這個技巧僅在應用選擇多行的時候有用,或者在使用索引範圍搜尋和應用發出多個查詢來得到連續的key時有效。對於隨機的唯一primary-key(主鍵)的訪問將不會由行重新排序中得到好處。
讓我們看一下它是如何工作的。考慮以下的一個SQL的查詢,它使用一個索引來得到100行:
select salary from employeewhere last_name like 'B%';
這個查詢將會使用last_name_index,搜尋其中的每一行來得到目標行。這個查詢將會至少使用100次物理磁碟的讀取,因為employee的行存放在不同的資料區塊中。
不過,如果表中的行已經重新排序為和last_name_index的一樣,同樣的查詢又會怎樣處理呢?我們可以看到這個查詢只需要三次的磁碟I/O就讀完全部100個員工的資料(一次用作索引的讀取,兩次用作資料區塊的讀取),減少了97次的塊讀取。
重新排序帶來的效能改善的程度在於在你開始的時候行的亂序性如何,以及你需要由序列中訪問多少行。至於一個表中的行與索引的排序鍵的匹配程度,可以查看資料字典中的dba_indexes和dba_tables視圖得到。
在dba_indexes的視圖中,查看clustering_factor列。如果clustering_factor的值和表中的塊數目大致一樣,那麼你的表和索引的順序是一樣的。不過,如果clustering_factor 的值接近表中的行數目,那就表明表格中的行和索引的順序是不一樣的。
行重新排序的作用是不可以小看的。在需要進行大範圍的索引搜尋的大表中,行重新排序可以令查詢的效能提高三倍。
一旦你已經決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。
. 使用Oracle的Create Table As Select (CTAS) 文法來拷貝表格
. Oracle9i內建的表格重新組織工具
以下,我們來看以下SQL語句的調優。
SQL調優
Oracle的SQL調優是一個複雜的主題,甚至是需要整本書來介紹Oracle SQL調優的細微差別。不過有一些基本的規則是每個Oracle DBA都需要跟從的,這些規則可以改善他們系統的效能。SQL調優的目標是簡單的:
. 消除不必要的大表全表搜尋:不必要的全表搜尋導致大量不必要的I/O,從而拖慢整個資料庫的效能。調優專家首先會根據查詢返回的行數目來評價SQL。在一個有序的表中,如果查詢返回少於40%的行,或者在一個無序的表中,返回少於7%的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜尋。對於不必要的全表搜尋來說,最常見的調優方法是增加索引。可以在表中加入標準的B樹索引,也可以加入bitmap和基於函數的索引。要決定是否消除一個全表搜尋,你可以仔細檢查索引搜尋的I/O開銷和全表搜尋的開銷,它們的開銷和資料區塊的讀取和可能的並存執行有關,並將兩者作對比。在一些情況下,一些不必要的全表搜尋的消除可以通過強制使用一個index來達到,只需要在SQL語句中加入一個索引的提示就可以了。
. 在全表搜尋是一個最快的存取方法時,將小表的全表搜尋放到緩衝中,調優專家應該確保有一個專門的資料緩衝用作行緩衝。在Oracle7中,你可以使用alter table xxx cache語句,在Oracle8或以上,小表可以被強製為放到KEEP池中緩衝。
. 確保最優的索引使用 :對於改善查詢的速度,這是特別重要的。有時Oracle可以選擇多個索引來進行查詢,調優專家必須檢查每個索引並且確保Oracle使用正確的索引。它還包括bitmap和基於函數的索引的使用。
. 確保最優的JOIN操作:有些查詢使用NESTED LOOP join快一些,有些則是HASH join快一些,另外一些則是sort-merge join更快。
這些規則看來簡單,不過它們占SQL調優任務的90%,並且它們也無需完全懂得Oracle SQL的內部運作。以下我們來簡單概覽以下Oracle SQL的最佳化。
我們首先簡要查看Oracle的排序,並且看一看排序操作是如何影響效能的。
調整Oracle的排序操作
排序是SQL文法中一個小的方面,但很重要,在Oracle的調整中,它常常被忽略。當使用create index、ORDER BY或者GROUP BY的語句時,Oracle資料庫將會自動執行排序的操作。通常,在以下的情況下Oracle會進行排序的操作:
使用Order by的SQL語句
使用Group by的SQL語句
在建立索引的時候
進行table join時,由於現有索引的不足而導致SQL最佳化器調用MERGE SORT
當與Oracle建立起一個session時,在記憶體中就會為該session分配一個私人的排序地區。如果該串連是一個專用的串連(dedicated connection),那麼就會根據init.ora中sort_area_size參數的大小在記憶體中分配一個Program Global Area (PGA) 。如果串連是通過多線程伺服器建立的,那麼排序的空間就在large_pool中分配。不幸的是,對於所有的session,用做排序的記憶體量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序地區。因此,設計者必須作出一個平衡,在分配足夠的排序地區以避免發生大的排序任務時出現磁碟排序(disk sorts)的同時,對於那些並不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了sort_area_size的大小時,這時將會在TEMP資料表空間中分頁進行磁碟排序。磁碟排序要比記憶體排序大概慢14,000倍。
上面我們已經提到,私人排序地區的大小是有init.ora中的sort_area_size參數決定的。每個排序所佔用的大小由init.ora中的sort_area_retained_size參數決定。當排序不能在分配的空間中完成時,就會使用磁碟排序的方式,即在Oracle執行個體中的暫存資料表空間中進行。
磁碟排序的開銷是很大的,有幾個方面的原因。首先,和記憶體排序相比較,它們特別慢;而且磁碟排序會消耗暫存資料表空間中的資源。Oracle還必須分配緩衝池塊來保持暫存資料表空間中的塊。無論什麼時候,記憶體排序都比磁碟排序好,磁碟排序將會令任務變慢,並且會影響Oracle執行個體的當前任務的執行。還有,過多的磁碟排序將會令free buffer waits的值變高,從而令其它任務的資料區塊由緩衝中移走。
接著,讓我們看一下Oracle的競爭,並且看一下表的儲存參數的設定是如何影響SQL UPDATE和INSERT語句的效能的。
調整Oracle的競爭
Oracle的其中一個優點時它可以管理每個資料表空間中的自由空間。Oracle負責處理表和索引的空間管理,這樣就可以讓我們無需懂得Oracle的表和索引的內部運作。不過,對於有經驗的Oracle調優專家來說,他需要懂得Oracle是如何管理表的extent和閒置資料區塊。對於調整擁有高的insert或者update的系統來說,這是非常重要的。
要精通對象的調整,你需要懂得freelists和freelist組的行為,它們和pctfree及pctused參數的值有關。這些知識對於企業資源計劃(ERP)的應用是特別重要的,因為在這些應用中,不正確的表設定通常是DML語句執行慢的原因。
對於初學者來說,最常見的錯誤是認為預設的Oracle參數對於所有的對象都是最佳的。除非磁碟的消耗不是一個問題,否則在設定表的pctfree和pctused參數時,就必須考慮平均的行長和資料庫的塊大小,這樣空的塊才會被有效地放到freelists中。當這些設定不正確時,那些得到的freelists也是"dead"塊,因為它們沒有足夠的空間來儲存一行,這樣將會導致明顯的處理延遲。
Freelists對於有效地重新使用Oracle資料表空間中的空間是很重要的,它和pctfree及pctused這兩個儲存參數的設定直接相關。通過將pctused設定為一個高的值,這時資料庫就會儘快地重新使用塊。不過,高效能和有效地重新使用表的塊是對立的。在調整Oracle的表格和索引時,需要認真考慮究竟需要高效能還是有效空間重用,並且據此來設定表的參數。以下我們來看一下這些freelists是如何影響Oracle的效能的。
當有一個請求需要插入一行到表格中時,Oracle就會到freelist中尋找一個有足夠的空間來容納一行的塊。你也許知道,freelist串是放在表格或者索引的第一個塊中,這個塊也被稱為段頭(segment header)。pctfree和pctused 參數的唯一目的就是為了控制塊如何在freelists中進出。雖然freelist link和 unlink是簡單的Oracle功能,不過設定freelist link (pctused) 和unlink (pctfree) 對Oracle的效能確實有影響。
由DBA的基本知識知道,pctfree參數是控制freelist un-links的(即將塊由freelists中移除)。設定pctfree=10 意味著每個塊都保留10%的空間用作行擴充。pctused參數是控制freelist re-links的。設定pctused=40意味著只有在塊的使用低於40%時才會回到表格的freelists中。
許多新手對於一個塊重新回到freelists後的處理都有些誤解。其實,一旦由於一個刪除的操作而令塊被重新加入到freelist中,它將會一直保留在freelist中即使空間的使用超過了60%,只有在到達pctfree時才會將資料區塊由freelist中移走。
表格和索引儲存參數設定的要求總結
以下的一些規則是用來設定freelists, freelist groups, pctfree和pctused儲存參數的。你也知道,pctused和pctfree的值是可以很容易地通過alter table命令修改的,一個好的DBA應該知道如何設定這些參數的最佳值。
有效地使用空間和高效能之間是有矛盾的,而表格的儲存參數就是控制這個方面的矛盾:
. 對於需要有效地重新使用空間,可以設定一個高的pctused值,不過副作用是需要額外的I/O。一個高的pctused值意味著相對滿的塊都會放到freelist中。因此,這些塊在再次滿之前只可以接受幾行記錄,從而導致更多的I/O。
. 追求高效能的話,可以將pctused設定為一個低的值,這意味著Oracle不會將資料區塊放到freelists中直到它幾乎是空的。那麼塊將可以在滿之前接收更多的行,因此可以減少插入操作的I/O。要記住Oracle擴充新塊的效能要比重新使用現有的塊高。對於Oracle來說,擴充一個表比管理freelists消耗更少的資源。
讓我們來回顧一下設定Object Storage Service參數的一些常見規則:
.經常將pctused設定為可以接收一條新行。對於不能接受一行的free blocks對於我們來說是沒有用的。如果這樣做,將會令Oracle的效能變慢,因為Oracle將在擴充表來得到一個空的塊之前,企圖讀取5個"dead"的free block。
.表格中chained rows的出現意味著pctfree太低或者是db_block_size太少。在很多情況下,RAW和LONG RAW列都很巨大,以至超過了Oracle的最大塊的大小,這時chained rows是不可以避免的。
.如果一個表有同時插入的SQL語句,那麼它需要有同時刪除的語句。運行單一個一個清除的工作將會把全部的空閑塊放到一個freelist中,而沒有其它包含有任何空閑塊的freelists出現。
.freelist參數應該設定為表格同時更新的最大值。例如,如果在任何時候,某個表最多有20個使用者執行插入的操作,那麼該表的參數應該設定為freelists=20。
應記住的是freelist groups參數的值只是對於Oracle Parallel Server和Real Application Clusters才是有用的。對於這類Oracle,freelist groups應該設定為訪問該表格的Oracle Parallel Server執行個體的數目。