在過去的十年中,Oracle已經成為世界上最專業的資料庫之一。對於IT專家來說,就是要確保利用Oracle的強大特性來提高他們公司的生產力。最有效方法之一是通過Oracle調優。它有大量的調整參數和技術來改進你的Oracle資料庫的效能。
Oracle調優是一個複雜的主題。關於調優可以寫整整一本書,不過,為了改善Oracle資料庫的效能,有一些基本的概念是每個Oracle DBA都應該遵從的。
在這篇簡介中,我們將簡要地介紹以下的Oracle主題:
--
外部調整:我們應該記住Oracle並不是單獨啟動並執行。因此我們將查看一下通過調整Oracle伺服器以得到高的效能。
--
Row re-sequencing以減少磁碟I/O:我們應該懂得Oracle調優最重要的目標是減少I/O。
--
Oracle SQL調整。Oracle SQL調整是Oracle調整中最重要的領域之一,只要通過一些簡單的SQL調優規則就可以大幅度地提升SQL語句的效能,這是一點都不奇怪的。
--
調整Oracle排序:排序對於Oracle效能也是有很大影響的。
--
調整Oracle的競爭:表和索引的參數設定對於UPDATE和INSERT的效能有很大的影響。
我們首先從調整Oracle外部的環境開始。如果記憶體和CPU的資源不足的話,任何的Oracle調整都是沒有協助的。
外部的效能問題
Oracle並不是單獨啟動並執行。Oracle資料庫的效能和外部的環境有很大的關係。這些外部的條件包括有:
.CPU--CPU資源的不足令查詢變慢。當查詢超過了Oracle伺服器的CPU效能時,你的資料庫效能就受到CPU的限制。
.記憶體--可用於Oralce的記憶體數量也會影響SQL的效能,特別是在資料緩衝和記憶體排序方面。
. 網路--大量的Net8通訊令SQL的效能變慢。
許多新手都錯誤的認為應該首先調整Oracle資料庫,而不是先確認外部資源是否足夠。實際上,如果外部環境出現瓶頸,再多的Oracle調整都是沒有協助的。
在檢查Oracle的外部環境時,有兩個方面是需要注意的:
1、當運行隊列的數目超過伺服器的CPU數量時,伺服器的效能就會受到CPU的限制。補救的方法是為伺服器增加額外的CPU或者關閉需要很多處理資源的組件,例如Oracle Parallel Query。
2、記憶體分頁。當記憶體分頁時,記憶體容量已經不足,而記憶體頁是與磁碟上的交換區進行互動的。補救的方法是增加更多的記憶體,減少Oracle SGA的大小,或者關閉Oracle的多線程伺服器。
可以使用各種標準的伺服器工具來得到伺服器的統計資料,例如vmstat,glance,top和sar。DBA的目標是確保資料庫伺服器擁有足夠的CPU和記憶體資源來處理Oracle的請求。
以下讓我們來看一下Oracle的row-resequencing是如何能夠極大地減少磁碟I/O的。
Row-resequencing(行的重新排序)
就象我們上面提到的,有經驗的Oracle DBA都知道I/O是回應時間的最大組成部分。其中磁碟I/O特別厲害,因為當Oracle由磁碟上的一個資料檔案得到一個資料區塊時,讀的進程就必須等待物理I/O操作完成。磁碟操作要比資料緩衝慢10,000倍。因此,如果可以令I/O最小化,或者減少由於磁碟上的檔案競爭而帶來的瓶頸,就可以大大地改善Oracle資料庫的效能。
如果系統響應很慢,通過減少磁碟I/O就可以有一個很快的改善。如果在一個事務中通過按一定的範圍搜尋primary-key索引來訪問表,那麼重新以CTAS的方法組織表將是你減少I/O的首要策略。通過在物理上將行排序為和primary-key索引一樣的順序,就可以加快獲得資料的速度。
就象磁碟的Server Load Balancer一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的DBA管理技巧一起使用,就可以在高I/O的系統中大大地減少響應的時間。
在高容量的線上交易處理環境中(online transaction processing,OLTP),資料是由一個primary索引得到的,重新排序表格的行就可以令連續塊的順序和它們的primary索引一樣,這樣就可以在索引 驅動的表格式查詢中,減少物理I/O並且改善回應時間。這個技巧僅在應用選擇多行的時候有用,或者在使用索引範圍搜尋和應用發出多個查詢來得到連續的key時有效。對於隨機的唯一primary-key(主鍵)的訪問將不會由行重新排序中得到好處。
讓我們看一下它是如何工作的。考慮以下的一個SQL的查詢,它使用一個索引來得到100行:
select salary from employee where last_name like 'B%'; |
這個查詢將會使用last_name_index,搜尋其中的每一行來得到目標行。這個查詢將會至少使用100次物理磁碟的讀取,因為employee的行存放在不同的資料區塊中。
不過,如果表中的行已經重新排序為和last_name_index的一樣,同樣的查詢又會怎樣處理呢。我們可以看到這個查詢只需要三次的磁碟I/O就讀完全部100個員工的資料(一次用作索引的讀取,兩次用作資料區塊的讀取),減少了97次的塊讀取。
重新排序帶來的效能改善的程度在於在你開始的時候行的亂序性如何,以及你需要由序列中訪問多少行。至於一個表中的行與索引的排序鍵的匹配程度,可以查看資料字典中的dba_indexes和dba_tables視圖得到。
在dba_indexes的視圖中,查看clustering_factor列。如果clustering_factor的值和表中的塊數目大致一樣,那麼你的表和索引的順序是一樣的。不過,如果clustering_factor 的值接近表中的行數目,那就表明表格中的行和索引的順序是不一樣的。
行重新排序的作用是不可以小看的。在需要進行大範圍的索引搜尋的大表中,行重新排序可以令查詢的效能提高三倍。
一旦你已經決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。
. 使用Oracle的Create Table As Select (CTAS) 文法來拷貝表格
. Oracle9i內建的表格重新組織工具
以下,我們來看以下SQL語句的調優。
SQL調優
Oracle的SQL調優是一個複雜的主題,甚至是需要整本書來介紹Oracle SQL調優的細微差別。不過有一些基本的規則是每個Oracle DBA都需要跟從的,這些規則可以改善他們系統的效能。SQL調優的目標是簡單的:
. 消除不必要的大表全表搜尋:不必要的全表搜尋導致大量不必要的I/O,從而拖慢整個資料庫的效能。調優專家首先會根據查詢返回的行數目來評價SQL。在一個有序的表中,如果查詢返回少於40%的行,或者在一個無序的表中,返回少於7%的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜尋。對於不必要的全表搜尋來說,最常見的調優方法是增加索引。可以在表中加入標準的B樹索引,也可以加入bitmap和基於函數的索引。要決定是否消除一個全表搜尋,你可以仔細檢查索引搜尋的I/O開銷和全表搜尋的開銷,它們的開銷和資料區塊的讀取和可能的並存執行有關,並將兩者作對比。在一些情況下,一些不必要的全表搜尋的消除可以通過強制使用一個index來達到,只需要在SQL語句中加入一個索引的提示就可以了。
. 在全表搜尋是一個最快的存取方法時,將小表的全表搜尋放到緩衝中,調優專家應該確保有一個專門的資料緩衝用作行緩衝。在Oracle7中,你可以使用alter table xxx cache語句,在Oracle8或以上,小表可以被強製為放到KEEP池中緩衝。
. 確保最優的索引使用 :對於改善查詢的速度,這是特別重要的。有時Oracle可以選擇多個索引來進行查詢,調優專家必須檢查每個索引並且確保Oracle使用正確的索引。它還包括bitmap和基於函數的索引的使用。
. 確保最優的JOIN操作:有些查詢使用NESTED LOOP join快一些,有些則是HASH join快一些,另外一些則是sort-merge join更快。
這些規則看來簡單,不過它們占SQL調優任務的90%,並且它們也無需完全懂得Oracle SQL的內部運作。以下我們來簡單概覽以下Oracle SQL的最佳化。
我們首先簡要查看Oracle的排序,並且看一看排序操作是如何影響效能的。
調整Oracle的排序操作
排序是SQL文法中一個小的方面,但很重要,在Oracle的調整中,它常常被忽略。當使用create index、ORDER BY或者GROUP BY的語句時,Oracle資料庫將會自動執行排序的操作。通常,在以下的情況下Oracle會進行排序的操作:
使用Order by的SQL語句
使用Group by的SQL語句
在建立索引的時候
進行table join時,由於現有索引的不足而導致SQL最佳化器調用MERGE SORT
當與Oracle建立起一個session時,在記憶體中就會為該session分配一個私人的排序地區。如果該串連是一個專用的串連(dedicated connection),那麼就會根據init.ora中sort_area_size參數的大小在記憶體中分配一個Program Global Area (PGA) 。如果串連是通過多線程伺服器建立的,那麼排序的空間就在large_pool中分配。不幸的是,對於所有的session,用做排序的記憶體量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序地區。因此, 設計者必須作出一個平衡,在分配足夠的排序地區以避免發生大的排序任務時出現磁碟排序(disk sorts)的同時,對於那些並不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了sort_area_size的大小時,這時將會在TEMP資料表空間中分頁進行磁碟排序。磁碟排序要比記憶體排序大概慢14,000倍。
上面我們已經提到,私人排序地區的大小是有init.ora中的sort_area_size參數決定的。每個排序所佔用的大小由init.ora中的sort_area_retained_size參數決定。當排序不能在分配的空間中完成時,就會使用磁碟排序的方式,即在Oracle執行個體中的暫存資料表空間中進行。
磁碟排序的開銷是很大的,有幾個方面的原因。首先,和記憶體排序相比較,它們特別慢;而且磁碟排序會消耗暫存資料表空間中的資源。Oracle還必須分配緩衝池塊來保持暫存資料表空間中的塊。無論什麼時候,記憶體排序都比磁碟排序好,磁碟排序將會令任務變慢,並且會影響Oracle執行個體的當前任務的執行。還有,過多的磁碟排序將會令free buffer waits的值變高,從而令其它任務的資料區塊由緩衝中移走。
接著,讓我們看一下Oracle的競爭,並且看一下表的儲存參數的設定是如何影響SQL UPDATE和INSERT語句的效能的。