由于歸檔日誌飄移導致OGG抓取進程停止(OGG-01028),oggogg-01028
基本要素 最近使用者反饋部署在RAC節點1的OGG的抓取進程已經停止運行幾天了,希望排查下原因,讓其恢複正常。問題分析
步驟一:查看日誌 通過info all命令,查看當前抓取進程的狀態,如下,狀態為ABENDED,這時我們最簡單的方式就是查看OGG的錯誤記錄檔資訊,該資訊檔名為ggserr.log,我們看下該錯誤記錄檔裡面的相關錯誤提示,如下:
這裡報OGG-01028錯誤,可以看到提示沒明確,找不到/u01/app/oracle/archive2/2_32522_828663513.dbf歸檔日誌,因為我們這裡是RAC環境,採用NFS的方式,把2號節點的歸檔目錄掛載到1號節點的/u01/app/oracle/archive2/目錄,因此該路徑下應該是2號節點的歸檔日誌。 我們查看了目錄確實沒有,因為是RAC節點,我們在1號節點去看下,發現該記錄檔在1號節點,這是由於使用者最近幾天在做伺服器重啟,由於VIP的跳躍,導致本來應該歸檔在2號節點的日誌,歸檔在了1號節點,因此我們只需要把該日誌拷貝到2號節點。解決過程
步驟一:拷貝日誌
我們把在1號節點裡面所有本應該歸檔到2號節點的日誌,全部拷貝回2號節點,用SCP命令遠程拷貝,如下:[oracle@rac01 archive]$ scp2_32* 192.168.30.3:/u01/app/oracle/archive2_32522_828663513.dbf 100% 10MB 10.0MB/s 00:01 2_32523_828663513.dbf 100% 1024 1.0KB/s 00:00 2_32540_828663513.dbf 100% 51MB 25.4MB/s 00:02 拷貝完後,再次嘗試啟動抓去進程,正常啟動
關鍵知識點RAC歸檔日誌的飄移:RAC環境下,由於某個節點意外關閉,其節點上的業務會回退,產生歸檔日誌,但是該節點又無法訪問,因此會將回退產生的歸檔日誌產生到其他節點上,這就是常見的歸檔日誌飄移。