使用Python實現一個簡單的項目監控_python

來源:互聯網
上載者:User

在公司裡做的一個介面系統,主要是對接第三方的系統介面,所以,這個系統裡會和很多其他公司的項目互動。隨之而來一個很蛋疼的問題,這麼多公司的介面,不同公司介面的穩定性差別很大,訪問量大的時候,有的不怎麼行的介面就各種出錯了。

這個介面系統剛剛開發不久,整個系統中,處於比較邊緣的位置,不像其他項目,有日誌庫,還有簡訊警示,一旦出問題,很多情況下都是使用者反饋回來,所以,我的想法是,拿起python,為這個項目寫一個監控。如果在調用某個第三方介面的過程中,大量出錯了,說明這個介面有有問題了,就可以更快的採取措施。

項目的也是有日誌庫的,所有的info,error日誌都是每隔一分鐘掃描入庫,日誌庫是用的mysql,表裡有幾個特別重要的欄位:

  •         level 記錄層級
  •         message 日誌內容
  •         file_name Java代碼檔案
  •         log_time 日誌時間

有日誌庫,就不用自己去線上環境掃日誌分析了,直接從日誌庫入手。由於日誌庫線上上時每隔1分鐘掃,那我就去日誌庫每隔2分鐘掃一次,如果掃到有一定數量的error日誌就警示,如果只有一兩條錯誤就可以無視了,也就是短時間爆發大量錯誤記錄檔,就可以斷定系統有問題了。警示方式就用發送郵件,所以,需要做下面幾件事情:
1. 操作MySql。
2. 發送郵件。
3. 定時任務。
4. 日誌。
5. 運行指令碼。

明確了以上幾件事情,就可以動手了。
操作資料庫

使用MySQLdb這個驅動,直接操作資料庫,主要就是查詢操作。
擷取資料庫的串連:
 

def get_con(): host = "127.0.0.1" port = 3306 logsdb = "logsdb" user = "root" password = "never tell you" con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8") return con

從日誌庫裡擷取資料,擷取目前時間之前2分鐘的資料,首先,根據目前時間進行計算一下時間。之前,計算有問題,現在已經修改。
 

def calculate_time():  now = time.mktime(datetime.now().timetuple())-60*2 result = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now)) return result

然後,根據時間和記錄層級去日誌庫查詢資料
 

def get_data(): select_time = calculate_time() logger.info("select time:"+select_time) sql = "select file_name,message from logsdb.app_logs_record " \   "where log_time >"+"'"+select_time+"'" \   "and level="+"'ERROR'" \   "order by log_time desc" conn = get_con()  cursor = conn.cursor() cursor.execute(sql) results = cursor.fetchall()  cursor.close() conn.close()  return results

發送郵件

使用python發送郵件比較簡單,使用標準庫smtplib就可以
這裡使用163郵箱進行發送,你可以使用其他郵箱或者企業郵箱都行,不過host和port要設定正確。
 

def send_email(content): sender = "sender_monitor@163.com"receiver = ["rec01@163.com", "rec02@163.com"]host = 'smtp.163.com'port = 465msg = MIMEText(content)msg['From'] = "sender_monitor@163.com"msg['To'] = "rec01@163.com,rec02@163.com"msg['Subject'] = "system error warning" try:smtp = smtplib.SMTP_SSL(host, port)smtp.login(sender, '123456')smtp.sendmail(sender, receiver, msg.as_string())logger.info("send email success")except Exception, e:logger.error(e)

定時任務

使用一個單獨的線程,每2分鐘掃描一次,如果ERROR層級的日誌條數超過5條,就發郵件通知。
 

def task():while True:logger.info("monitor running") results = get_data()if results is not None and len(results) > 5:content = "recharge error:"logger.info("a lot of error,so send mail")for r in results:content += r[1]+'\n'send_email(content)sleep(2*60)

日誌

為這個小小的指令碼配置一下日誌log.py,讓日誌可以輸出到檔案和控制台中。

# coding=utf-8import logging logger = logging.getLogger('mylogger')logger.setLevel(logging.DEBUG) fh = logging.FileHandler('monitor.log')fh.setLevel(logging.INFO) ch = logging.StreamHandler()ch.setLevel(logging.INFO) formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')fh.setFormatter(formatter)ch.setFormatter(formatter) logger.addHandler(fh)logger.addHandler(ch)

所以,最後,這個監控小程式就是這樣的app_monitor.py

# coding=utf-8import threadingimport MySQLdbfrom datetime import datetimeimport timeimport smtplibfrom email.mime.text import MIMETextfrom log import logger  def get_con(): host = "127.0.0.1" port = 3306 logsdb = "logsdb" user = "root" password = "never tell you" con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8") return con  def calculate_time():  now = time.mktime(datetime.now().timetuple())-60*2 result = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now)) return result  def get_data(): select_time = calculate_time() logger.info("select time:"+select_time) sql = "select file_name,message from logsdb.app_logs_record " \   "where log_time >"+"'"+select_time+"'" \   "and level="+"'ERROR'" \   "order by log_time desc" conn = get_con()  cursor = conn.cursor() cursor.execute(sql) results = cursor.fetchall()  cursor.close() conn.close()  return results  def send_email(content):  sender = "sender_monitor@163.com" receiver = ["rec01@163.com", "rec02@163.com"] host = 'smtp.163.com' port = 465 msg = MIMEText(content) msg['From'] = "sender_monitor@163.com" msg['To'] = "rec01@163.com,rec02@163.com" msg['Subject'] = "system error warning"  try:  smtp = smtplib.SMTP_SSL(host, port)  smtp.login(sender, '123456')  smtp.sendmail(sender, receiver, msg.as_string())  logger.info("send email success") except Exception, e:  logger.error(e)  def task(): while True:  logger.info("monitor running")  results = get_data()  if results is not None and len(results) > 5:   content = "recharge error:"   logger.info("a lot of error,so send mail")   for r in results:    content += r[1]+'\n'   send_email(content)  time.sleep(2*60)  def run_monitor(): monitor = threading.Thread(target=task) monitor.start()  if __name__ == "__main__": run_monitor()

運行指令碼

指令碼在伺服器上運行,使用supervisor進行管理。
在伺服器(centos6)上安裝supervisor,然後在/etc/supervisor.conf中加入一下配置:

複製代碼 代碼如下:
[program:app-monitor]
command = python /root/monitor/app_monitor.py
directory = /root/monitor
user = root

然後在終端中運行supervisord啟動supervisor。
在終端中運行supervisorctl,進入shell,運行status查看指令碼的運行狀態。
總結

這個小監控思路很清晰,還可以繼續修改,比如:監控特定的介面,傳送簡訊通知等等。
因為有日誌庫,就少了去線上正式環境掃描日誌的麻煩,所以,如果沒有日誌庫,就要自己上線上環境掃描,在正式線上環境一定要小心哇~

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.