標籤:
1.建立正確的系統管理思想 7*24系統營運{ 每周7天每天24小時不間斷系統監控 每天8:00~24:00為使用者訪問時間 每天2:00~6:00為可維護或可停機時間 穩定性監控、設定檔備份、資料庫結構 備份可在使用者訪問時間完成 系統、應用、平台的遷移操作必須在可維 護時間內完成(例如:服務上下線) 線上資料庫的任何離線操作均需在可維護 時間內完成(例如:資料庫遷移)}營運工程師要求{ 保證服務達到上線標準,保證上線服務穩定且安全 不斷的提升應用服務的可靠性與健壯性, 效能不斷最佳化並保證安全性逐步提高 網站各層面監控(軟體、硬體、運行狀態等),避免監控死角、並能即時瞭解應用的運轉情況 通過創新思維解決營運效率問題;不斷最佳化自動化指令碼,使用新技術不斷解決新問題。 積累與沉澱營運知識,不斷完善文檔,避免重複性範錯。 需要計劃性和執行力;工作有計劃、有具體的實施步驟,計劃後想方設法達到目標,不找借口。 能對日常監控工作進行提煉,設計並開發營運工具,利用現有系統或指令碼產生可視化統計圖}如何在工作中避免出錯{ 先備份後修改 備份所有,在你毀滅系統前 備份檔案帶上時間戳記和機器名或IP地址 最好異地備份 備份前打包零碎檔案 許可權(包括擁有者和擁有組)也要備份 別忘了連結檔案 把操作步驟寫下來,執行前確認一次 目標端和源端各開一個視窗 盡量讓不同的主機視窗呈現不同顏色 覆蓋檔案前三思而後行 mv永遠比rm安全 留下操作記錄是你對團隊的責任和他人繼續你工作的保證}營運安全考慮{ 保護自己和保護使用者同樣重要 解讀保密協議 不要把客戶的資料帶離公司 你可以看到所有的資料,但出於職業道德 你不能看,即使看了也要忘掉 將一天的操作記錄下來並彙報 小心永遠比粗心更利於你的成長}日常需要提交的文檔{ 日報 周報 月報 操作計劃待審報告 項目操作及結果彙報 普遍性問題匯總報告 無法解決問題匯總報告}日常時間管理{ 當你需要集中精神的時候,關掉你的QQ和微博,機調到震動或飛行 把任務分類,重要且緊急的事先做,然後是重要的事情 每小時查看一次郵件而不是每分鐘 制定自己的時間表,最好是GTD式的 操作前分類業務,通用性操作盡量自動化 推薦閱讀--《時間管理—給系統管理員》} 優秀的系統管理員的能力{ 1. 自發識別系統管理任務能力 2. 實現最佳實務思想能力 ○ 標準化 Standardization ○ 集中化 Centralization ○ 擴充性 Scalability ○ 條理性 Provisioning ○ 自動化 Automation 3. 避免“一次性(OneOff)”陷阱能力 4. 使用系統管理工具能力}日常系統管理工作{ 1. 系統啟動和關閉 2. 日常所需維護的 ○ 檔案系統完整性和空閑磁碟空間 ○ 諸多設定檔 ○ 軟體的安裝 ○ 使用者認證 ○ 安全 ○ 系統監控 ○ 部署新系統 ○ 整合舊系統}標準化{ 1. 制定計劃 ○ 系統安裝和升級 ○ 軟體安裝和升級 安裝任何軟體的時候你都應遵循如下順序: 1) 首先在實驗機或測試機上安裝測試這個應用的原始碼或是二進位方式程式 2) 為第三方軟體建立可以在你伺服器上安裝的伺服器系統支援的安裝包結構(類RedHat 的系統使用 RPM 方式,類 Debian 的系統使用 DEB 方式,類 BSD 的系統多使用 TAR 方式) 3) 在實驗機或測試機上測試你打包的應用程式軟體安裝包 4) 將軟體包部署到需要它的系統中去 5) 在部署伺服器上核實其健全狀態 6) 如有必要可以恢複之前的系統結構和配置 2. 建立標準文檔 • 檔案系統列表 • 第三方軟體列表 注意版本資訊 • 設定檔列表 • 你認為所有重要的東西}設定檔列表{ who 程式 when 時間 why 為什麼修改 what 修改的內容}文檔規格{ 要求 方案 操作步驟 問題和答案 系統監控 部署系統 整合舊系統}}
零基礎學習雲端運算及大資料DBA叢集架構師【企業級營運技術及實踐項目2015年1月21日周四】