ORA-00600 kcratr_nab_less_than_odr 解決方案
今天由於客戶現場異常斷電,Oracle資料庫又無法啟動了,遠程上去看看吧。
1.資料庫只能mount,已經無法啟動
SQL> select status from v$instance;
STATUS
------------
MOUNTED
SQL> ALTER DATABASE OPEN;
ALTER DATABASE OPEN
*
ERROR at line 1:
ORA-01589: must use RESETLOGS or NORESETLOGS option for database open
2.嘗試recover和resetlogs open都不行
SQL> recover database;
ORA-00283: recovery session canceled due to errors
ORA-01610: recovery using the BACKUP CONTROLFILE option must be done
SQL> ALTER DATABASE OPEN resetlogs;
ALTER DATABASE OPEN resetlogs
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: 'D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF'
3.Alert log 顯示錯誤
~~~~~~~~~~~~~~~~
Sun Jan 14 19:52:29 2018
ALTER DATABASE OPEN
Beginning crash recovery of 1 threads
parallel recovery started with 3 processes
......
Started redo scan
Completed redo scan
read 2300 KB redo, 0 data blocks need recovery
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc (incident=315209):
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
Incident details in: d:\app\oracle\diag\rdbms\prjdb\prjdb\incident\incdir_315209\prjdb_ora_1644_i315209.trc
Aborting crash recovery due to error 600
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc:
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc:
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
ORA-600 signalled during: ALTER DATABASE OPEN...
~~~~~~~~~~~~~~~~~~~
4.結合ALERT裡的錯誤ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870],是由於伺服器異常斷電,導致LGWR寫redo log時失敗,
下次重新啟動資料庫時,需要做執行個體級恢複,而又無法從聯機記錄檔裡擷取到這些redo資訊,因為上次斷電時,寫日誌失敗了。
5.那麼ORA-00600的錯誤裡,那幾個參數 [1], [29904], [4864], [4870]的含義是,執行個體需要恢複sequence為29904的redo檔案,需要恢複到編號為4870的日誌塊,而實際上只能恢複到第4864個日誌塊兒,所以資料庫就不能正常啟動。
6.那我們怎麼辦呢?先檢查一下控制檔案和datafile記錄的checkpoint_change#資訊吧。
資料檔案檢查點(記錄在控制檔案中)
SQL> select file#,checkpoint_change#,last_change# from v$datafile where rownum<5;
FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
---------- ------------------ ------------
1 664629049
2 664629049
3 664629049
4 664629049
系統檢查點(記錄在控制檔案中)
SQL> select checkpoint_change# from v$database;
CHECKPOINT_CHANGE#
---------- ------------------ ------------
664607310
資料檔案頭檢查點(記錄在資料檔案中)
SQL> select file#,checkpoint_change# from v$datafile_header where rownum<5;
FILE# CHECKPOINT_CHANGE#
---------- ------------------
1 664629049
2 664629049
3 664629049
4 664629049
-7. 以上三個checkpoint_change#要一致(唯讀、離線資料表空間除外),資料庫才能正常開啟。否則會需要進行一步的處理。正常關庫時,會產生新的檢查點,寫入上述三個checkpoint_change#,同時資料檔案中的last_change#也會記錄下該檢查點,也就是說三個checkpoint_change#與last_change#記錄著同一個值。
-8. 通過上面的錯誤,以及checkpoint_change#的不一致,已經可以確認,就是控制檔案,由於斷電。導致的controlfile損壞(checkpoint_change#不一致)。
-9. 由於沒有備份,我們只能通過重建controlfile的方式,來解決這個問題。
指定trace檔案的產生路徑
SQL> alter database backup controlfile to trace as '/tmp/controlfile.trc';
組建檔案提取建庫指令碼如下,啟動資料庫到nomount狀態,執行下面指令碼。
注意:類似的恢複操作,先將現有的資料庫進行備份。即使這個資料庫已經無法啟動。我們也要防止恢複操作導致的更嚴重的問題。
CREATE CONTROLFILE REUSE DATABASE "PRJDB" NORESETLOGS FORCE LOGGING ARCHIVELOG
MAXLOGFILES 16
MAXLOGMEMBERS 3
MAXDATAFILES 200
MAXINSTANCES 8
MAXLOGHISTORY 584
LOGFILE
GROUP 1 'D:\APP\ORACLE\ORADATA\PRJDB\REDO01.LOG' SIZE 50M BLOCKSIZE 512,
GROUP 2 'D:\APP\ORACLE\ORADATA\PRJDB\REDO02.LOG' SIZE 50M BLOCKSIZE 512,
GROUP 3 'D:\APP\ORACLE\ORADATA\PRJDB\REDO03.LOG' SIZE 50M BLOCKSIZE 512
DATAFILE
'D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF',
'D:\APP\ORACLE\ORADATA\PRJDB\SYSAUX01.DBF',
'D:\APP\ORACLE\ORADATA\PRJDB\UNDOTBS01.DBF',
'D:\APP\ORACLE\ORADATA\PRJDB\USERS01.DBF'
CHARACTER SET US7ASCII;
-10. 檢查資料庫狀態
SQL> select status from v$instance;
STATUS
------ ----- -
MOUNTED
-11. 嘗試重啟一下,看到是需要恢複的(其實我是知道這樣起不來的,但是就像任性的看看報錯)。
SQL> alter database open;
alter database open
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: 'D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF'
-12. 恢複資料庫,其實啥也沒做,recover就是走個過場,但是必須得走這個流程。
SQL> recover database;
Media recovery complete.
11.啟動資料庫,成功
SQL> alter database open;
Database altered.
SQL> select status from v$instance;
STATUS
--- --------
OPEN
12.再看看checkpoint_change#值,統一了吧。
SQL> select file#,checkpoint_change#,last_change# from v$datafile where rownum<5;
FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
---------- ------------------ ------------
1 664649053
2 664649053
3 664649053
4 664649053
SQL> select checkpoint_change# from v$database;
CHECKPOINT_CHANGE#
------------------
664649053
SQL> select file#,checkpoint_change# from v$datafile_header where rownum<5;
FILE# CHECKPOINT_CHANGE#
---------- ------------------
1 664649053
2 664649053
3 664649053
4 664649053
最後,再嘮叨一下,備份真的很重要!很簡單!沒有備份的資料庫,不單單是裸奔那麼簡單!不出問題,丟人!出問題,傷身啊!!
如何重建控制檔案,請參考:https://www.bkjia.com/Linux/2018-03/151561.htm
https://www.bkjia.com/topicnews.aspx?tid=12
本文永久更新連結地址:https://www.bkjia.com/Linux/2018-03/151562.htm