在11.2中,CRSD進程不再是RAC中最關鍵的進程之一。
如果對10g RAC比較熟悉,應該清楚CRSD進程的重要性,Oracle在作業系統啟動後,就是通過啟動這個進程然後啟動整個CLUSTER以及資料庫的。
在11.2的RAC中,Oracle調整了ASM,使得OCR和VOT可以儲存在ASM磁碟組中。ASM是CLUSTER所支援的一個組件,而CLUSTER啟動所需的OCR和VOT卻要放在ASM中,這其實要解決一個先有雞還是先有蛋的問題。最終Oracle通過OHASD進程的方式解決了這個問題,而整個CLUSTER和ASM的架構也發生了重大的變化,OHASD進程取代了CRSD進程變成了RAC環境中最關鍵的進程。
而CRSD進程的重要性已經低到難以置信的地步,前兩天在一個客戶的11.2 RAC環境中發現,即使一個節點的CRSD進程沒有啟動,仍然可以手工啟動資料庫,且資料庫可以正常訪問。
導致的問題原因應該是節點2上訪問OCR和VOT所在的磁碟組出現了錯誤,導致CRSD在多次嘗試擷取OCR中儲存的資訊失敗後自動結束,從而使得節點2無法正常的啟動。不過這時節點2上除了CRSD進程外,其他的CLUSTER進程已經完全啟動,ASM執行個體也可以啟動,這時可以手工啟動節點2上的資料庫。
節點2上ASM的alert有如下的錯誤資訊:
Tue Jan 18 14:09:18 2011
NOTE: client +ASM2:+ASM registered, osid 13113, mbr 0x0
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13108.trc:
ORA-15081: failed to submit an I/O operation to a disk
WARNING: failed to online diskgroup resource ora.DATADG.dg (unable to communicate with CRSD/OHASD)
Tue Jan 18 14:09:19 2011
NOTE: [crsd.bin@findb2 (TNS V1-V3) 13121] opening OCR file
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
本文URL:http://www.bianceng.cn/database/Oracle/201410/45638.htm
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13130.trc:
ORA-15081: failed to submit an I/O operation to a disk
Tue Jan 18 14:09:20 2011
WARNING: failed to online diskgroup resource ora.FRADG.dg (unable to communicate with CRSD/OHASD)
Tue Jan 18 14:09:21 2011
NOTE: [crsd.bin@findb2 (TNS V1-V3) 13134] opening OCR file
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:
ORA-15180: could not open dynamic library ASM Library - Generic Linux, version 2.0.4 (KABI_V2), error [open]
ERROR: error ORA-15180 caught in ASM I/O path
Errors in file /u01/app/grid/diag/asm/+asm/+ASM2/trace/+ASM2_ora_13143.trc:
ORA-15081: failed to submit an I/O operation to a disk
應該就是這個原因導致ocrd進程報錯並退出。資料庫可以正常開啟,節點2上資料庫和監聽無法自動啟動,vip也存在問題。此外節點2上需要ocr資訊的工具都無法使用,比如ocrconfig、ocrcheck以及srvctl等。
當然一般而言,這種問題是無法接受的,這個問題最終通過重建RAC環境解決。不過這個案例也說明了10g和11g中CLUSTER的結構發生了多大的變化。