python进程监控 supervisor_使用Python的Supervisor进行进程监控以及自动启动
做服務(wù)器端開(kāi)發(fā)的同學(xué)應(yīng)該都對(duì)進(jìn)程監(jiān)控不會(huì)陌生,最近恰好要更換 uwsgi 為 gunicorn,而gunicorn又恰好有這么一章講進(jìn)程監(jiān)控,所以多研究了下。
結(jié)合之前在騰訊工作的經(jīng)驗(yàn),也會(huì)講講騰訊的服務(wù)器監(jiān)控是怎么做的。同時(shí)也會(huì)講下小團(tuán)隊(duì)又該怎么敏捷的解決。
下面按照監(jiān)控的方法依次介紹。
一、按照進(jìn)程名監(jiān)控
在騰訊內(nèi)部所有server都是要打包發(fā)布的,而在打包過(guò)程中是需要填寫(xiě)要監(jiān)控的進(jìn)程名,然后在crontab中定時(shí)通過(guò)ps查詢(xún)進(jìn)程是否存在。
這種方法是比較簡(jiǎn)單的方法,但是考慮到很多進(jìn)程會(huì)在啟動(dòng)之后改名,以及進(jìn)程名存在各種特殊字符,多個(gè)進(jìn)程同時(shí)存在的問(wèn)題,實(shí)際操作起來(lái)并不是很舒服。
舉個(gè)簡(jiǎn)單的例子,gunicorn啟動(dòng)之后的進(jìn)程名類(lèi)似這樣 master: [wsgi:app],其中的方括號(hào)在grep時(shí)要記得轉(zhuǎn)義,否則就會(huì)出問(wèn)題。
不過(guò)不管怎么說(shuō),這種方法在很多其他方式用不了的時(shí)候反而是最簡(jiǎn)單的方法。
下面是用python的實(shí)現(xiàn):
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
二、按照端口監(jiān)控
這種方式之前在騰訊打包的時(shí)候也有用,但是可能是進(jìn)程名更直觀的原因吧,貌似一直沒(méi)怎么用起來(lái)。
不過(guò)現(xiàn)在自己在做包部署的時(shí)候,反而覺(jué)得端口監(jiān)控是個(gè)最靠譜的事情了。這個(gè)也沒(méi)什么好多說(shuō)的,直接上剛寫(xiě)完的python代碼:
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
有的朋友可能說(shuō)對(duì)于tcp端口檢查,其實(shí)以client的方式來(lái)connect()看是否成功會(huì)不會(huì)更好?其實(shí)我覺(jué)得這種方式也挺好的,并且對(duì)于不同的協(xié)議可以再深入處理一下,比如對(duì)http協(xié)議可以用urllib2.urlopen確保返回正確的包才算正常。不過(guò)如果這么做的話,就有點(diǎn)偏黑盒監(jiān)控 了,比如監(jiān)控寶、阿里云監(jiān)控之類(lèi)的服務(wù)了。
三、通過(guò)監(jiān)控server啟動(dòng)進(jìn)程,并以監(jiān)控子進(jìn)程的方式監(jiān)控
這個(gè)也是在gunicorn頁(yè)面上看到的,說(shuō)起來(lái)gunicorn很不厚道的把gaffer放到第一個(gè),讓我還以為是個(gè)很成熟的產(chǎn)品,結(jié)果發(fā)現(xiàn)連啟動(dòng)都是個(gè)問(wèn)題。
相反排在后面的supervisor反而相當(dāng)?shù)暮糜?#xff0c;下面是截圖:
supervisor可以很方便的管理進(jìn)程,包括重啟,停止等等,而且提供了web界面和用戶驗(yàn)證,可以很方便的在線管理。
但是有好處就有壞處,用了supervisor之后,就不能自己隨便的去自己重啟服務(wù)了,否則會(huì)影響supervisor的監(jiān)控,這對(duì)我這種喜歡自己執(zhí)行 xx.sh restart 的人實(shí)在有點(diǎn)太痛苦了。當(dāng)然,其實(shí)要是習(xí)慣了去supervisorctl 里面start/stop/reload 之后也就還好了。
用supervisor配置gunicorn的配置項(xiàng)如下:
[program:yuanzhaopin]
environment=PYTHON_EGG_CACHE=/tmp/.python-eggs/,PYTHONPATH=/data/release/yuanzhaopin
command=/usr/local/bin/gunicorn --debug --log-level debug --log-file /tmp/g.log wsgi:app
user=zny2008
autorestart=true
redirect_stderr=true
ok,目前自己常用的就是這幾種模式了,大家如果有其他選擇歡迎留言討論。
完整代碼如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#*/1 * * * * python /xxx/monitor.py >> /xxx/logs/monitor.log 2>&1? &
import sys
import subprocess
import os.path as op
import socket
def this_abs_path(script_name):
return op.abspath(op.join(op.dirname(__file__), script_name))
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
#=============================================================================
def yuanzhaopin():
cmd = '%s start' % this_abs_path('gun.sh')
#monitor_process('\[yuanzhaopin\]', cmd)
monitor_port('tcp', 8635, cmd)
def main():
yuanzhaopin()
if __name__ == '__main__':
main()
總結(jié)
以上是生活随笔為你收集整理的python进程监控 supervisor_使用Python的Supervisor进行进程监控以及自动启动的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python methodtype_Py
- 下一篇: python调用ansysworkben