調整Oracle應用系統效能的原則和方法
轉載 來源: 中國IT實驗室 作者: 未知
摘要:通過探討和研究Oracle伺服器和Client/Server的特點和原理,闡述了提高、調整Oracle應用系統效能的一些原則和方法。
關鍵詞:Oracle;客戶/伺服器;系統全程區;網路I/O;復原段。
Oracle 資料庫廣泛應用在社會的各個領域,特別是在Client/Server模式的應用,但是應用開發人員往往碰到整個系統的效能隨著資料量的增大顯著下降的問題,為瞭解決這個問題,從以下幾個方面:資料庫伺服器、網路I/O、應用程式等對整個系統加以調整,充分發揮Oracle的效能,提高整個系統的效能。
1 調整資料庫伺服器的效能
Oracle資料庫伺服器是整個系統的核心,它的效能高低直接影響整個系統的效能,為了調整Oracle資料庫伺服器的效能,主要從以下幾個方面考慮:
1.1 調整作業系統以適合Oracle資料庫伺服器運行
Oracle資料庫伺服器很大程度上依賴於運行伺服器的作業系統,如果作業系統不能提供最好效能,那麼無論如何調整,Oracle資料庫伺服器也無法發揮其應有的效能。
1.1.1 為Oracle資料庫伺服器規劃系統資源
據已有電腦可用資源, 規劃分配給Oracle伺服器資源原則是:儘可能使Oracle伺服器使用資源極大化,特別在Client/Server中盡量讓伺服器上所有資源都來運行Oracle服務。
1.1.2 調整電腦系統中的記憶體配置
多數作業系統都用虛存來類比電腦上更大的記憶體,它實際上是硬碟上的一定的磁碟空間。當實際的記憶體空間不能滿足應用軟體的要求時,作業系統就將用這部分的磁碟空間對記憶體中的資訊進行頁面替換,這將引起大量的磁碟I/O操作,使整個伺服器的效能下降。為了避免過多地使用虛存,應加大電腦的記憶體。
1.1.3 為Oracle資料庫伺服器設定作業系統進程優先順序
不要在作業系統中調整Oracle進程的優先順序,因為在Oracle資料庫系統中,所有的後台和前台資料庫伺服器進程執行的是同等重要的工作,需要同等的優先順序。所以在安裝時,讓所有的資料庫伺服器進程都使用預設的優先順序運行。
1.2 調整記憶體配置
Oracle資料庫伺服器保留3個基本的記憶體快取,分別對應3種不同類型的資料:庫快取,字典快取和緩衝區快取。庫快取和字典快取一起構成共用池,共用池再加上緩衝區快取便構成了系統全程區(SGA)。SGA是對資料庫資料進行快速存取的一個系統全程區,若SGA本身需要頻繁地進行釋放、分配,則不能達到快速存取資料的目的,因此應把SGA放在主存中,不要放在虛擬記憶體中。記憶體的調整主要是指調整組成SGA的記憶體結構的大小來提高系統效能,由於Oracle資料庫伺服器的記憶體結構需求與應用密切相關,所以記憶體結構的調整應在磁碟I/O調整之前進行。
1.2.1 庫緩衝區的調整
庫緩衝區中包含私用和共用SQL和PL/SQL區,通過比較庫緩衝區的命中率決定它的大小。要調整庫緩衝區,必須首先瞭解該庫緩衝區的活動情況,庫緩衝區的活動統計資訊保留在動態效能表v$librarycache資料字典中,可通過查詢該表來瞭解其活動情況,以決定如何調整。
Select sum(pins),sum(reloads) from v$librarycache; |
Pins列給出SQL語句,PL/SQL塊及被訪問對象定義的總次數;Reloads列給出SQL 和PL/SQL塊的隱式分析或對象定義重裝載時在庫程式緩衝區中發生的錯誤。如果sum(pins)/sum(reloads) ≈0,則庫緩衝區的命中率合適;若sum(pins)/sum(reloads)>1, 則需調整初始化參數 shared_pool_size來重新調整分配給共用池的記憶體量。
1.2.2 資料字典緩衝區的調整
資料字典緩衝區包含了有關資料庫的結構、使用者、實體資訊。資料字典的命中率,對系統效能影響極大。資料字典緩衝區的使用方式記錄在動態效能表v$librarycache中,可通過查詢該表來瞭解其活動情況,以決定如何調整。
Select sum(gets),sum(getmisses) from v$rowcache; |
Gets列是對相應項請求次數的統計;Getmisses 列是引起緩衝區出錯的資料的請求次數。對於頻繁訪問的資料字典緩衝區,sum(getmisses)/sum(gets)<10%~15%。若大於此百分數,則應考慮增加資料字典緩衝區的容量,即需調整初始化參數shared_pool_size來重新調整分配給共用池的記憶體量。
1.2.3 緩衝區快取的調整
使用者進程所存取的所有資料都是經過緩衝區快取來存取,所以該部分的命中率,對效能至關重要。緩衝區快取的使用方式記錄在動態效能表v$sysstat中,可通過查詢該表來瞭解其活動情況,以決定如何調整。
Select name,value from v$sysstat where name in ('dbblock gets','consistent gets','physical reads'); |
dbblock gets和consistent gets的值是請求資料緩衝區中讀的總次數。physical reads的值是請求資料時引起從盤中讀檔案的次數。從緩衝區快取中讀的可能性的高低稱為緩衝區的命中率,計算公式:
Hit Ratio=1-(physical reds/(dbblock gets+consistent gets))
如果Hit Ratio<60%~70%,則應增大db_block_buffers的參數值。db_block_buffers可以調整分配給緩衝區快取的記憶體量,即db_block_buffers可設定分配緩衝區快取的資料區塊的個數。緩衝區快取的總位元組數=db_block_buffers的值*db_block_size的值。db_block_size 的值表示資料區塊大小的位元組數,可查詢 v$parameter 表:
select name,value from v$parameter where name='db_block_size'; |
在修改了上述資料庫的初始化參數以後,必須先關閉資料庫,在重新啟動資料庫後才能使新的設定起作用。
1.3 調整磁碟 I/O
磁碟的I/O速度對整個系統效能有重要影響。解決好磁碟I/O問題,可顯著提高效能。影響磁碟I/O的效能的主要原因有磁碟競爭、I/O次數過多和資料區塊空間的分配管理。
為Oracle資料庫伺服器建立新檔案時,不論是資料表空間所用的資料檔案還是資料事務登入所用的記錄檔,都應仔細考慮資料庫伺服器上的可用的磁碟資源。如果伺服器上有多個磁碟,則可將檔案分散儲存到各個可用的磁碟上,減少對資料庫的資料檔案及交易記錄檔的競爭,從而有效地改善伺服器的效能。對於不同的應用系統都有各自的資料集,應當創見不同的資料表空間分別儲存各自應用系統的資料,並且儘可能的把資料表空間對應的資料檔案存放在不同的磁碟上,這種從物理上把每個應用系統的資料表空間分散存放的方法,可以排除兩個應用系統競爭磁碟的可能性。資料檔案、交易記錄檔分別存放在不同的磁碟上,這樣交易處理執行的磁碟訪問不妨礙對相應的事物日誌登記的磁碟訪問。如果有多個磁碟可用,將兩個事物日誌成員放在不同的磁碟機上,就可以消除記錄檔可能產生的磁碟競爭。應把一個應用的表資料和索引資料分散存放不同資料表空間上,並且盡量把不同類型的資料表空間存放在不同磁碟上,這樣就消除了表資料和索引資料的磁碟競爭。
1.4 調整資料庫伺服器的復原段
復原段是一個儲存地區,資料庫使用該儲存地區存放曾經由一個事務更新或刪除的行的未經處理資料值。如果使用者要復原一個事務所做的改變,那麼資料庫就從復原段中讀回改變前的資料並使該事務影響的行改變為它們的原狀態。復原段控制著資料庫處理事務的能力,因而在資料庫成功中起著關鍵性的作用,不管資料庫的其它部分設計得多好,如果它設計得不合理,將會嚴重影響系統的效能。建立和調整復原段的原則如下。
1.4.1 分離復原段
分離復原段是指單獨為復原段建立一個以上的資料表空間,使復原段與資料字典、使用者資料、索引等分離開來。由於復原段的寫入與資料和索引的寫入是並行進行的,因此將它分離出來可以減少I/O爭用。如果復原段與資料不分離,倘若要某個資料表空間離線或撤消,那麼在該資料表空間中的各個復原段沒有全部離線之前,不能將這個資料表空間離線或撤消。而一旦該資料表空間不可用,則該資料表空間中的所有復原段也不能使用,這將浪費所有分配的磁碟空間。所以,獨立復原段可使資料庫管理變得容易。復原段的經常性收縮,使得資料表空間的自由塊更容易形成片段。分離復原段可以減少資料庫資料表空間的片段產生。
1.4.2 建立不同大小的復原段群
對於一些聯機事物處理,他們一般是頻繁地對少量資料進行修改,建立許多小的復原段對之有利。每一個事物的入口項只能限於一個復原段,復原段應該充分大以容納一個完整的事物處理,因此對一些較大型事物,需要較大型的復原段。極個別離線處理事物會產生大量的復原資訊,這時需要一個特大號的復原段來處理。根據這些理論,在Oracle資料庫伺服器中針對上述3種事物處理建立三組:小事物組、較大事物組、特大事物組等大小不同的復原段群,並且將之分散到3個不同的資料表空間上,群內大小相同,應能滿足該組事物處理的最大要求。
1.4.3 建立數量適當的復原段
一般復原段數量與並發事物個數有關,以下給出由於並發事物個數而應建立復原段的參考數:
並發事物(n) 復原段數n<16 416 ≤ n<32 8n≥ 32 n/4 |
2 調整 Client/Server 模式下的網路 I/O
Client/Server環境中的應用處理是分布在客戶應用程式和資料庫服務程式之間的。在 Client/Server環境中Client與Server之間的網路I/O是整個系統效能提高的瓶頸,一個客戶應用程式引起的網路I/O越少,應用及整個系統的效能越好。減少網路I/O的最重要的一條原則:將應用邏輯集中在資料庫伺服器中。
2.1 使用Oracle資料庫的完整約束性
當為應用建表時,應當為一些有特殊要求的資料加上適當的完整性條件約束,這樣就能實現由資料庫本身而不是應用程式來約束資料符合一定的條件。資料庫伺服器端的完整約束的執行操作是在比SQL語句層級更低的系統機制上最佳化,它與用戶端無關,只在伺服器中運行,不需在Client 端和Server端之間傳遞SQL語句,有效地減輕網路I/O負擔。
2.2 使用資料庫觸發器
完整約束性只能實現一些較簡單的資料約束條件,對一些較複雜的事物處理規則就無能為力,這時最好不要在應用程式中實施複雜的程式控制,而是應當採用資料庫觸發器來實施複雜的事物規則。資料庫觸發器能實現由資料庫本身,而不是應用程式,來約束資料符合複雜的事物處理規則,並且容易建立,便於管理,避免大量的網路I/O。
例如:將當前表A中成為曆史的記錄從A表中轉儲到曆史表B中,表示為Lsbs。
在應用程式中實現: 用資料庫觸發器實現:Beign Create trigger delete1 Update A set lsbs='T'; After update of lsbs on A Insert into B For each row Select * from A where lsbs='T'; Insert into B Delete A where lsbs='T'; select * from A where :new.lsbs='T';End; Delete A where :new.lsbs='T'; End delete1; |
在應用程式中實現時,所有的SQL命令請求傳送的資料都要通過網路在Client端和Server端進行交換,而不像資料庫觸發器一樣,SQL本身在Server端,不需要通過網路傳輸資料。當進行操作的資料量相當大時,並且多個使用者同時操作時,通過在應用程式中實現複雜的控制,必將增大網路I/O的負荷,使整個系統的效能降低,而用資料庫觸發器能完全避免這種情況發生。
2.3 使用預存程序、儲存函數和包
Oracle的預存程序和儲存函數是命名的能完成一定功能並且儲存在Server端的PL/SQL的集合。包是一種把有關的過程和函數組織封裝成一個資料庫程式單元的方法。它們相對於應用程式的過程、函數而言,把SQL命令儲存在Server端。使用預存程序和儲存函數,應用程式不必再包含多個網路操作的SQL語句去執行資料庫伺服器操作,而是簡單調用預存程序和儲存函數,在網路上傳輸的只是調用過程的名字和輸出結果,這樣就可減少大量的網路I/O。
例如:基表A、B的定義:name char(20);detail char(10);A表100萬記錄,應用程式將從基表A中檢索detail列符合給出條件的記錄,並將之插入基表B。
DeclareCursor cursor1 is select*from A;poin cursor1%type;con1 number(2);res1 char(4)='abcd';Begin Insert into B values(poin.name,poin.detail);end if;For poin in cursor1 loop End loop;End loop;For con1 in 1..7 loop Commit;If substr(poin.detail ,con1,4)=res1 then End; |
如果在Developer/2000 From中按鈕觸發器直接用PL/SQL實現和把它改寫為一個Oracle預存程序,然後在From中調用此過程實現比較,後者效能顯著提高。
在考慮使用上述3種方法時:首先考慮使用完整約束性。對於資料庫觸發器和預存程序,如果需要所有訪問資料庫的程式自動實施一定規則或檢查,那麼使用資料庫觸發器;如果只需對少數的程式實施一定的規則或檢查,則可建立一個過程,讓有關程式調用這個過程。
3 應用程式的調整
3.1 SQL語句的最佳化
SQL語句的執行速度,可以受很多因素的影響而變化。但主要的影響因素是:驅動表、執行操作的先後順序和索引的運用。可以由很多不同的方法間接地改變這些因素,以達到最優的執行速度。這裡主要探討當對多個表進行串連查詢時應遵循的最佳化原則:
(1) 用於串連的子句的列應被索引、在Where子句中應盡量利用索引,而不是避開索引。
(2) 串連操作應從返回較少行上驅動。
(3) 如果所串連的表A和B,A表長度遠遠大於B表,建議從較大的A表上驅動。
(4) 如果Where子句中含有選擇性條件,Where No=20,將最具有選擇性部分放在運算式最後。
(5) 如果只有一個表有索引,另一表無索引,無索引的表通常作為驅動表。如A表的No列以被索引,而B表的No 列沒被索引,則應當B表作為驅動表,A表作為被驅動表。
(6) 若用於串連的列和Where子句中其他選擇條件列均有索引,則按各個索引對查詢的有效性和選擇性分別定出層級,結合表中具體資料構成情況,從中選出最佳化路徑,一般需要考慮:子句中哪些列可以使用索引、哪些索引具有唯一性及被查詢表行數目等。
3.2 建立和使用視圖、索引
利用視圖可以將基表中的列或行進行裁減、隱藏一部分資料,並且能夠將涉及到多個表的複雜查詢以視圖的方式給出,使應用程式開發簡潔快速。利用索引可以提高查詢效能,減少磁碟 I/O,最佳化對資料表的查詢,加速SQL語句的執行。但任何時候建立索引都能提高效能,何時建立索引應當遵循以下原則:該表常用來在索引列上查詢,該表不常更新、插入、刪除等操作,查詢出來的結果記錄數應控制在原表的2%~4%。
3.3 使用 Oracle 的數組介面
當一個客戶應用程式插入一行或用一個查詢來向伺服器請求某行時,不是發送具有單個行的網路包,而是採用數組處理,即把要插入的多個行或檢索出的多個行緩衝在數組中,然後通過很少的幾個包就可在網上傳送這些數組。例如,一個給定的Select語句返回2000行資料,每行平均大小為40個位元組,資料包的大小為4kB,而數組大小參數(arraysize)設定為20 ,則需從伺服器發送100個資料包到客戶機。如果簡單地把(arraysize)設定為2000,那麼同樣的操作只需要傳送 20個資料包。這樣就減少了網路的傳輸量,提高了所有應用的效能。
4 總結
我們在開發應用程式時,遵循上述的方法和原則,對系統進行調整,收到了令人滿意的效果。但是應當指出,由於客戶機、網路、伺服器這3個相互依存的組成部分都必須調整和同步才能產生最佳的效能,因此還應根據系統的具體情況,具體分析和調整。