| 多的時侯,做Oracle DBA的我們,當應用管理員向我們通告現在應用很慢、資料庫很慢的時侯,我們到資料庫時做幾個樣本的Select也發現同樣的問題時,有些時侯我們會無從下手,因為我們認為資料庫的各種命種率都是滿足Oracle文檔的建議。實際上如今的最佳化己經向最佳化等待(waits)轉型了,實際中效能最佳化最根本的出現點也都集中在IO,這是影響效能最主要的方面,由系統中的等待去發現Oracle庫中的不足、作業系統某些資源利用的不合理是一個比較好的辦法,下面把我的一點實踐經驗與大家分享一下,本文測重於Unix環境。 一、通過作業系統的一些工具檢查系統的狀態,比如CPU、記憶體、交換、磁碟的利用率,根據經驗或與系統正常時的狀態相比對,有時系統資料表面上看起來看空閑這也可能不是一個正常的狀態,因為cpu可能正等待IO的完成。除此之外我們還應觀注那些佔用系統資源(cpu、記憶體)的進程。 1、如何檢查作業系統是否存在IO的問題?使用的工具有sar,這是一個比較通用的工具。 Rp1#Sar -u 2 10 即每隔2秒檢察一次,共執行20次,當然這些都由你決定了。 樣本返回: HP-UX hpn2 B.11.00 U 9000/800 08/05/03 18:26:32 %usr %sys %wio %idle 18:26:34 80 9 12 0 18:26:36 78 11 11 0 18:26:38 78 9 13 1 18:26:40 81 10 9 1 18:26:42 75 10 14 0 18:26:44 76 8 15 0 18:26:46 80 9 10 1 18:26:48 78 11 11 0 18:26:50 79 10 10 0 18:26:52 81 10 9 0 Average 79 10 11 0 其中的%usr指的是使用者進程使用的cpu資源的百分比,%sys指的是系統資源使用cpu資源的百分比,%wio指的是等待io完成的百分比,這是值得我們觀注的一項,%idle即閒置百分比。如果wio列的值很大,如在35%以上,說明你的系統的IO存在瓶頸,你的CPU花費了很大的時間去等待IO的完成。Idle很小說明系統CPU很忙。像我的這個樣本,可以看到wio平均值為11說明io沒什麼特別的問題,而我的idle值為零,說明我的cpu已經滿負荷運行了。 當你的系統存在IO的問題,可以從以下幾個方面解決 *聯絡相應的作業系統的支援人員對這方面進行最佳化,比如hp-ux在劃定卷組時的條帶化等方面。 *尋找Oracle中不合理的sql語句,對其進行最佳化 *對Oracle中訪問量頻繁的表除合理建索引外,再就是把這些表分資料表空間存放以免訪問上產生熱點,再有就是對錶合理分區。 2、關注一下記憶體。 常用的工具便是vmstat,對於hp-unix來說可以用glance,Aix來說可以用topas,當你發現vmstat中pi列非零,memory中的free列的值很小,glance,topas中記憶體的利用率多於80%時,這時說明你的記憶體方面應該調節一下了,方法大體有以下幾項。 *劃給Oracle使用的記憶體不要超過系統記憶體的1/2,一般保在系統記憶體的40%為益。 為系統增加記憶體 *如果你的串連特別多,可以使用MTS的方式 *打全補丁,防止記憶體漏洞。 3、如何找到點用系用資源特別大的Oracle的session及其執行的語句。 Hp-unix可以用glance,top IBM AIX可以用topas 此外可以使用ps的命令。 通過這些程式我們可以找到點用系統資源特別大的這些進程的進程號,我們就可以通過以下的sql語句發現這個pid正在執行哪個sql,這個sql最好在pl/sql developer,toad等軟體中執行, 把<>中的spid換成你的spid就可以了。 SELECT a.username, a.machine, a.program, a.sid, a.serial#, a.status, c.piece, c.sql_text FROM v$session a, v$process b, v$sqltext c WHERE b.spid= AND b.addr=a.paddr AND a.sql_address=c.address(+) ORDER BY c.piece 我們就可以把得到的這個sql分析一下,看一下它的執行計畫是否走索引,對其最佳化避免全表掃描,以減少IO等待,從而加快語句的執行速度。 提示:我在做最佳化sql時,經常碰到使用in的語句,這時我們一定要用exists把它給換掉,因為Oracle在處理In時是按Or的方式做的,即使使用了索引也會很慢。 比如: SELECT col1,col2,col3 FROM table1 a WHERE a.col1 not in (SELECT col1 FROM table2) 可以換成: SELECT col1,col2,col3 FROM table1 a WHERE not exists (SELECT 'x' FROM table2 b WHERE a.col1=b.col1) 4、另一個有用的指令碼:尋找前十條效能差的sql. SELECT * FROM ( SELECT PARSING_USER_ID EXECUTIONS, SORTS, COMMAND_TYPE, DISK_READS, sql_text FROM v$sqlarea ORDER BY disk_reads DESC ) WHERE ROWNUM<10 ; 二、迅速發現Oracle Server的效能問題的成因,我們可以求助於v$session_wait這個視圖,看系統的這些session在等什麼,使用了多少的IO。以下是我提供的參考指令碼: 指令碼說明:查看佔io較大的正在啟動並執行session SELECT se.sid, se.serial#, pr.SPID, se.username, se.status, se.terminal, se.program, se.MODULE, se.sql_address, st.event, st.p1text, si.physical_reads, si.block_changes FROM v$session se, v$session_wait st, v$sess_io si, v$process pr WHERE st.sid=se.sid AND st.sid=si.sid AND se.PADDR=pr.ADDR AND se.sid>6 AND st.wait_time=0 AND st.event NOT LIKE '%SQL%' ORDER BY physical_reads DESC 對檢索出的結果的幾點說明: 1、我是按每個正在等待的session已經發生的物理讀排的序,因為它與實際的IO相關。 2、你可以看一下這些等待的進程都在忙什麼,語句是否合理? Select sql_address from v$session where sid=; Select * from v$sqltext where address=; 執行以上兩個語句便可以得到這個session的語句。 你也以用alter system kill session 'sid,serial#';把這個session殺掉。 3、應觀注一下event這列,這是我們調優的關鍵一列,下面對常出現的event做以簡要的說明: a、buffer busy waits,free buffer waits這兩個參數所標識是dbwr是否夠用的問題,與IO很大相關的,當v$session_wait中的free buffer wait的條目很小或沒有的時侯,說明你的系統的dbwr進程決對夠用,不用調整;free buffer wait的條目很多,你的系統感覺起來一定很慢,這時說明你的dbwr已經不夠用了,它產生的wio已經成為你的資料庫效能的瓶頸,這時的解決辦法如下: a.1增加寫進程,同時要調整db_block_lru_latches參數 樣本:修改或添加如下兩個參數 db_writer_processes=4 db_block_lru_latches=8 a、2開非同步IO,IBM這方面簡單得多,hp則麻煩一些,可以與Hp工程師聯絡。 b、db file sequential read,指的是順序讀,即全表掃描,這也是我們應該盡量減少的部分,解決方案就是使用索引、sql調優,同時可以增大db_file_multiblock_read_count這個參數。 c、db file scattered read,這個參數指的是通過索引來讀取,同樣可以通過增加db_file_multiblock_read_count這個參數來提高效能。 d、latch free,與栓相關的了,需要專門調節。 e、其他參數可以不特別觀注。 |