公司資訊化系統建設按生命週期可分為IT規劃階段、IT建設階段和IT營運階段,其中,IT營運階段的時間最長,IT營運管理關乎著IT營運的品質、成本和速度,更關乎著IT系統的安全、連續和可用。大資料雲端運算時代的來臨,使Oracle服務商需要集中精力提高營運服務核心競爭力,才能促使營運外包走向更深的發展。
1.資料安全
資料安全是第一位的,Oracle服務商的首要職責必須保證不丟資料,丟掉資料就丟掉了飯碗!
1)在人為誤操作的時候(update,insert,delete,drop,alter),能夠恢複資料到正確的狀態。主要靠備份來保證,因為複製可以容災,卻不可以容錯(當然延遲備份在一定程度可以)。
2)在機房,硬體故障或者作業系統,資料庫軟體故障的時候,能夠恢複資料到正確的狀態。可能用備份來恢複,也可能直接進行主庫或者從庫的切換來恢複服務。
3)不丟事務,保證已經入庫的資料能夠被正確的查詢到。採用最高安全層級的資料庫軟硬體設定以及冗餘裝置,目標是不丟任何1個事務,因為即使1個事務也可能造成大量金錢的損失,同時造成企業信譽的下降。
4)還要注意到需要保證主從資料庫的一致性,否則讀寫分離的情況下其實在使用者看來仍然丟失了資料。
2.無故障(停機)時間
營運和開發不一樣,開發最重要的是保證一定效率的情況下實現功能,同時程式Bug少。營運講的是提供穩定服務的時間。用術語來說就是幾個9,具體含義就是年度不可服務(不管是主動的還是被動的)時間除以全年時間,百分比越高越好(基本可用性:2個9;較高可用性:3個9;具有故障自動回複能力的可用性:4個9;極高可用性:5個9)。Oracle營運服務的最高境界當然就是5個9了,一年停機時間只有5分鐘,這是相當難以達到的目標,往往一個大故障就會把全年的停機時間用完。
多數情況下,網站可用性會是 SLA (Service Level Agreement, 服務水平協議) 中的一個重要度量指標。如果是做第三方託管,需要明確第三方的營運服務能力與責任。否則,IDC 經常斷電或者斷網,即使自身做的再好也無法保證服務時間了。
但可用性是能夠持續改進的東西,營運負責人不可希望一步登天。提高可用性的一些常規策略有消除單點,部署冗餘裝置等。如果要提供更高的可用性,比如 4 個 9 甚至 5 個9,就不是簡單靠硬體就能做到的事情,還需要建立自動化的工具與平台,完善的流程制度與變更機制,7*24小時的專人值班等。
3.回應時間
回應時間是指一條查詢或者更新語句從發出請求到接收完資料的時間。因為最大回應時間的不確定性和不可重複性,所以一般使用X%的查詢回應時間作為指標。如果值為95%為10ms,意味著95%的查詢會在10ms內返回。對於OLTP查詢來說,在50ms內返回是比較理想的結果。超過200ms的查詢可以視為慢查詢。
4.成本
在解決了穩定和速度後,就是成本的問題了。成本的構成主要是硬體成本+軟體成本+人力成本,因為互連網企業軟體以自主開發和開源為主,所以其中主要是硬體和人力成本,硬體成本也包含了機房的機架,頻寬,電力成本。Oracle營運構師的使命的確不僅僅是“完成”功能,如果說完成功能可以有50種方法,那麼至少要找出相對較優的幾種方法並進行最終的選擇。因此Oracle服務商需要提高硬體的使用效率,降低人工營運成本,提高人均產出。