oracle 常見等待事件及處理方法

來源:互聯網
上載者:User

看書筆記db file scattered read DB ,db file sequential read DB,free buffer waits,log buffer space,log file switch,log file sync
我們可以通過視圖v$session_wait來查看系統當前的等待事件,以及與等待事件相對應的資源的相關資訊,從而可確定出產生瓶頸的類型及其對象。v$session_wait的p1、p2、p3告訴我們等待事件的具體含義,根據事件不同其內容也不相同,下面就一些常見的等待事件如何處理以及如何定位熱點對象和阻塞會話作一些介紹。
<1> db file scattered read DB 檔案分散讀取 (太多索引讀,全表掃描-----調整代碼,將小表放入記憶體)
這種情況通常顯示與全表掃描相關的等待。當全表掃描被限制在記憶體時,它們很少會進入連續的緩衝區內,而是分散於整個緩衝儲存空間中。如果這個數目很大,就表明該表找不到索引,或者只能找到有限的索引。儘管在特定條件下執行全表掃描可能比索引掃描更有效,但如果出現這種等待時,最好檢查一下這些全表掃描是否必要。因為全表掃描被置於LRU(Least Recently Used,最近最少適用)列表的冷端(cold end),所以應盡量儲存較小的表,以避免一次又一次地重複讀取它們。
==================================================
該類事件的p1text=file#,p1是file_id,p2是block_id,通過dba_extents即可確定出熱點對象(表或索引)
select owner,segment_name,segment_type
from dba_extents
where file_id = &file_id
and &block_id between block_id and block_id + &blocks - 1;
==================================================
<2> db file sequential read DB 檔案順序讀取 (表串連順序不佳-----調整代碼,特別是表串連)
這一事件通常顯示單個塊的讀取(如索引讀取)。這種等待的數目很多時,可能顯示表的串連順序不佳,或者不加選擇地進行索引。對於大量交易處理、調整良好的系統,這一數值大多是很正常的,但在某些情況下,它可能暗示著系統中存在問題。你應當將這一等待統計量與Statspack 報告中的已知問題(如效率較低的SQL)聯絡起來。檢查索引掃描,以保證每個掃描都是必要的,並檢查多表串連的串連順序。DB_CACHE_SIZE 也是這些等待出現頻率的決定因素。有問題的散欄區域(Hash-area)串連應當出現在PGA 記憶體中,但它們也會消耗大量記憶體,從而在順序讀取時導致大量等待。它們也可能以直接路徑讀/寫等待的形式出現。
===================================================
該類事件的p1text=file#,p1是file_id,p2是block_id,通過dba_extents即可確定出熱點對象(表或索引)
select owner,segment_name,segment_type
from dba_extents
where file_id = &file_id
and &block_id between block_id and block_id + &blocks - 1;
==================================================
<3> free buffer waits 釋放緩衝區等待 (增大DB_CACHE_SIZE,加速檢查點,調整代碼)
這種等待表明系統正在等待記憶體中的緩衝,因為記憶體中已經沒有可用的緩衝空間了。如果所有SQL 都得到了調優,這種等待可能表示你需要增大DB_BUFFER_CACHE。釋放緩衝區等待也可能表示不加選擇的SQL 導致資料溢出了帶有索引塊的緩衝儲存空間,沒有為等待系統處理的特定語句留有緩衝區。這種情況通常表示正在執行相當多數量的DML(插入/更新/刪除),並且資料庫書寫器(DBWR)寫的速度不夠快,緩衝儲存空間可能充滿了相同緩衝器的多個版本,從而導致效率非常低。為瞭解決這個問題,可能需要考慮增加檢查點、利用更多的DBWR 進程,或者增加物理磁碟的數量。
<4> buffer busy waits 緩衝區忙等待 (BUFFER熱塊)
這是為了等待一個以非共用方式使用的緩衝區,或者正在被讀入緩衝儲存空間的緩衝區。緩衝區忙等待不應大於1%。檢查緩衝等待統計部分(或V$WAITSTAT):
A、如果等待處於欄位頭部,應增加自由列表(freelist)的組數,或者增加pctused到pctfree之間的距離。
B、如果等待處於回退段(undo)頭部塊,可以通過增加復原段(rollback segment)來解決緩衝區的問題;
C、如果等待處於回退段(undo)非頭部塊上,就需要降低驅動一致讀取的表中的資料密度,或者增大DB_CACHE_SIZE;
D、如果等待處於資料區塊,可以將資料移到另一資料區塊以避開這個"熱"資料區塊、增加表中的自由列表或使用LMT資料表空間;
E、如果等待處於索引塊,應該重建索引、分割索引或使用反向鍵索引。
為了防止與資料區塊相關的緩衝忙等待,也可以使用較小的塊:在這種情況下,單個塊中的記錄就較少,所以這個塊就不是那麼"繁忙"。在執行DML(插入/更新/刪除)時,Oracle DBWR就向塊中寫入資訊,包括所有對塊狀態"感興趣"的使用者(感興趣的事務表,ITL)。為減少這一地區的等待,可以增加initrans,這樣會在塊中建立空間,從而使你能夠使用多個ITL槽。你也可以增加該塊所在表中的pctfree(當根據指定的initrans 建立的槽數量不足時,這樣可以使ITL 資訊數量達到maxtrans 指定的數量)。
<6> enqueue
enqueue 是一種保護共用資源的鎖定機制。該鎖定機制保護共用資源,如記錄中的資料,以避免兩個人在同一時間更新同一資料。enqueue 包括一個排隊機制,即FIFO(先進先出)排隊機制。注意:Oracle 的latch 機制不是FIFO。Enqueue 等待通常指的是ST enqueue、HW enqueue、TX4 enqueue 和TM enqueue。
A、ST enqueue 用於空間管理和字典管理的資料表空間的分配。利用LMT,或者試圖對地區進行預分配,或者至少使下一個地區大於有問題的字典管理的資料表空間。
B、HW enqueue 與段的高水位標記一起使用;手動分配地區可以避免這一等待。
C、TX4 enqueue是最常見的enqueue 等待,通常是以下三個問題之一產生的結果:
第一個問題是唯一索引中的重複索引,需要執行提交(commit)/復原(rollback)操作來釋放enqueue。
第二個問題是對同一位元影像索引段的多次更新。因為單個位元影像段可能包含多個行地址(rowid),所以當多個使用者試圖更新同一段時,你需要執行提交或復原操作,以釋放enqueue。
第三個問題,也是最可能發生的問題是多個使用者同時更新同一個塊。如果沒有自由的ITL槽,就會發生塊級鎖定。通過增大initrans 和/或maxtrans以允許使用多個ITL槽,或者增大表上的pctfree 值,就可以很輕鬆地避免這種情況。
D、TM enqueue 在DML 期間產生,以避免對受影響的對象使用DDL。如果有外來關鍵字,一定要對它們進行索引,以避免這種常見的鎖定問題。
<7> log buffer space 日誌緩衝空間 (寫REDO慢-----增大log_buffer,redo log file放到快速磁碟上)
當日誌緩衝(log buffer)寫入重做日誌(redo log)的速度比LGWR 的寫入速度慢,或者是當日誌轉換(log switch)太慢時,就會發生這種等待。為解決這個問題,可以增大記錄檔的大小,或者增加日誌緩衝器的大小,或者使用寫入速度更快的磁碟。甚至可以考慮使用固態磁碟,因為它們的速度很高。
<8> log file switch 記錄檔轉換 (歸檔慢-----增加或者擴大重做日誌)
有兩種情況:
A、log file switch (archiving needed)
當日誌切換的時候由於日誌組迴圈使用了一圈但日誌歸檔還沒有完成,通常是io有嚴重問題,可增大記錄檔和增加日誌組,調整log_archive_max_processes
B、log file switch (checkpoint incomplete)
當日誌切換的時候由於日誌組迴圈使用了一圈但將被使用的日誌組中的checkpoint還沒有完成造成,通常是io有嚴重問題,可增大記錄檔和增加日誌組
<9> log file sync 記錄檔同步 (提交太頻繁----批量提交)
當使用者commit的時候通知lgwr寫日誌但lwgr正忙,造成的可能原因是commit太頻繁或者lgwr一次寫日誌時間太長(可能是因為一次log io size 太大),可調整 _log_io_size,結合log_buffer,使得 (_log_io_size*db_block_size)*n = log_buffer,這樣可避免和增大log_buffer引起衝突;放置記錄檔於高速磁碟上
<10> library cache pin
該事件通常是發生在先有會話在運行PL/SQL,VIEW,TYPES等object時,又有另外的會話執行重新編譯這些object,即先給對象加上了一個共用鎖定,然後又給它加排它鎖,這樣在加排它鎖的會話上就會出現這個等待。P1,P2可與x$kglpn和x$kglob表相關
X$KGLOB (Kernel Generic Library Cache Manager Object)
X$KGLPN (Kernel Generic Library Cache Manager Object Pins)
-- 查詢X$KGLOB,可找到相關的object,其SQL語句如下
(即把V$SESSION_WAIT中的P1raw與X$KGLOB中的KGLHDADR相關連)
select kglnaown,kglnaobj from X$KGLOB
where KGLHDADR =(select p1raw from v$session_wait
where event='library cache pin')
-- 查出引起該等待事件的阻塞者的sid
select sid from x$kglpn , v$session
where KGLPNHDL in
(select p1raw from v$session_wait
where wait_time=0 and event like 'library cache pin%')
and KGLPNMOD <> 0
and v$session.saddr=x$kglpn.kglpnuse
-- 查出阻塞者正執行的SQL語句
select sid,sql_text
from v$session, v$sqlarea
where v$session.sql_address=v$sqlarea.address
and sid=<阻塞者的sid>
這樣,就可找到"library cache pin"等待的根源,從而解決由此引起的效能問題。
<11> library cache lock
該事件通常是由於執行多個DDL操作導致的,即在library cache object上添加一個排它鎖後,又從另一個會話給它添加一個排它鎖,這樣在第二個會話就會產生等待。可通過到基表x$kgllk中尋找其對應的對象。
-- 查詢引起該等待事件的阻塞者的sid、會話使用者、鎖住的對象
select b.sid,a.user_name,a.kglnaobj
from x$kgllk a , v$session b
where a.kgllkhdl in
(select p1raw from v$session_wait
where wait_time=0 and event = 'library cache lock')
and a.kgllkmod <> 0
and b.saddr=a.kgllkuse
當然也可以直接從v$locked_objects中查看,但沒有上面語句直觀根據sid可以到v$process中查出pid,然後將其kill或者其它處理。
<5> latch free (等待LATCH FREE)
latch是一種低級排隊機制(它們被準確地稱為相互排斥機制),用於保護系統全域地區(SGA)中共用記憶體結構。latch 就像是一種快速地被擷取和釋放的記憶體鎖。latch 用於防止共用記憶體結構被多個使用者同時訪問。如果latch 不可用,就會記錄latch 釋放失敗。大多數latch 問題都與以下操作相關:不能使用邦定變數(庫緩衝latch)、重複產生問題(重複分配latch)、緩衝儲存空間競爭問題(緩衝器儲存LRU 鏈),以及緩衝儲存空間中的"熱"塊(緩衝儲存空間鏈)。也有一些latch 等待與bug(程式錯誤)有關,如果懷疑是這種情況,可以檢查MetaLink 上的bug 報告。
該事件的熱點對象可通過以下語句尋找,其中&2值是v$session_wait中的P1RAW,x$bh中的欄位Hladdr表示該block buffer在哪個cache buffer chain latch 上,可以通過v$latch_children定位哪些segment是熱點塊。
===================================================
select a.hladdr, a.file#, a.dbablk, a.tch, a.obj, b.object_name
from x$bh a, dba_objects b
where (a.obj = b.object_id or a.obj = b.data_object_id)
and a.hladdr = &2
union
select hladdr, file#, dbablk, tch, obj, null
from x$bh
where obj in
(select obj from x$bh
where hladdr = &2
minus
select object_id from dba_objects
minus
select data_object_id from dba_objects)
and hladdr = &2
order by 4;
====================================================
***Latch 問題及可能解決辦法
------------------------------
* Library Cache and Shared Pool (未綁定變數---綁定變數,調整shared_pool_size)
每當執行SQL或PL/SQL預存程序,包,函數和觸發器時,這個Latch即被用到.Parse操作中此Latch也會被頻繁使用.
* Redo Copy (增大_LOG_SIMULTANEOUS_COPIES參數)
重做拷貝Latch用來從PGA向重做日誌緩衝區拷貝重做記錄.
* Redo Allocation (最小化REDO產生,避免不必要提交)
此Latch用來分配重做日誌緩衝區中的空間,可以用NOLOGGING來減緩競爭.
* Row Cache Objects (增大共用池)
資料字典競爭.過度parsing.
* Cache Buffers Chains (_DB_BLOCK_HASH_BUCKETS應增大或設為質數)
"過熱"資料區塊造成了記憶體緩衝鏈Latch競爭.
* Cache Buffers Lru Chain (調整SQL,設定DB_BLOCK_LRU_LATCHES,或使用多個緩衝區池)
掃描全部記憶體緩衝區塊的LRU(最近最少使用)鏈時要用到記憶體緩衝區LRU鏈Latch.太小記憶體緩衝區、過大的記憶體緩衝區輸送量、過多的記憶體中進行的排序操作、DBWR速度跟不上工作負載等會引起此Latch競爭。
<12> db file parallel write
與DBWR進程相關的等待,一般代表了I/O能力出現了問題. 通常與配置的多個DBWR進程或者DBWU的I/O slaves個數有關.當然也可能意味著裝置上存在著I/O競爭
<13> db file single write
表示在檢查點發生時與檔案頭寫操作相關的等待.通常與檢查點同步資料檔案頭時檔案號的紊亂有關.
<14> direct path read 和 direct path write
表示與直接I/O讀相關的等待.當直接讀資料到PGA記憶體時,direct path read 出現.這種類型的讀請求典型地作為:排序IO(為排序不能在記憶體中完成的時候),並行Slave查詢或者預先讀請求等. 通常這種等待與I/O能力或者I/O競爭有關.
<15> free buffer inspected
表示在將資料讀入資料調整緩衝區的時候等待進程找到足夠大的內在空間通常這類等待表示資料調整緩衝區偏小.
<16> library cache load lock
表示在將對象裝載到庫快取時出現了等待.這種事件通常代表著發生了負荷爾蒙很重的語句重載或者裝載,可能由於SQL語句沒有共用或者共用池地區編小造成的.
<17> log file parallel write
表示等待LGWR向作業系統請求I/O開始直到完成IO.在觸發LGWR寫的情況下如3秒、1/3、1MB、DBWR寫之前可能發生.這種事件發生通常表示記錄檔發生了I/O競爭或者檔案所在的磁碟機較慢
<18> log file single write
表示寫記錄檔頭塊時出現了等待.一般都是發生在檢查點發生時.
<19> transaction
表示發生了一個阻塞復原操作的等待
<20> undo segment extension
表示在等待復原段的動態擴充.這表示可能事務量過大,同時也意味著可能復原段的寢大小不是最優,MINEXTENTS設定得偏小.考慮減少事務,或者使用最小區數更大的復原段.
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.