最后更新于 .

记得刚入职的时候,那时候什么都不懂,组长让我跑个迁移程序,还没跑完就关终端走人了,结果可想而知,那是第一次知道守护进程的概念。
当时后来是加了nohup参数解决的,

nohup ./program &


但是总是强迫别人用nohup来启动自己的程序毕竟不是办法,所以还是要把自己的进程变成守护进程才行。

C/C++的版本就不说了,这里有篇文章写的很清楚。
http://colding.bokee.com/5277082.html

这里主要介绍一下在网上无意发现的一个国外哥们的写的python版本:
http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/
顺便吐个槽,这哥们用的Vim配色明显是Wombat~~
代码如下(对私有函数名加了_前缀,便于理解,并加了一定的注释):

#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys, os, time, atexit
from signal import SIGTERM
class Daemon:
    """
    A generic daemon class.
    
    Usage: subclass the Daemon class and override the _run() method
    """
    def __init__(self, pidfile, stdin='/dev/null', stdout='/dev/null', stderr='/dev/null'):
        self.stdin = stdin
        self.stdout = stdout
        self.stderr = stderr
        self.pidfile = pidfile

    def _daemonize(self):
        """
        do the UNIX double-fork magic, see Stevens' "Advanced 
        Programming in the UNIX Environment" for details (ISBN 0201563177)
        http://www.erlenstar.demon.co.uk/unix/faq_2.html#SEC16
        """

        #脱离父进程
        try:
            pid = os.fork()
            if pid > 0:
                sys.exit(0)
        except OSError, e:
            sys.stderr.write("fork #1 failed: %d (%s)\n" % (e.errno, e.strerror))
            sys.exit(1)

        #脱离终端
        os.setsid()
        #修改当前工作目录  
        os.chdir("/")
        #重设文件创建权限
        os.umask(0)

        #第二次fork,禁止进程重新打开控制终端
        try:
            pid = os.fork()
            if pid > 0:
                sys.exit(0)
        except OSError, e:
            sys.stderr.write("fork #2 failed: %d (%s)\n" % (e.errno, e.strerror))
            sys.exit(1)

        sys.stdout.flush()
        sys.stderr.flush()
        si = file(self.stdin, 'r')
        so = file(self.stdout, 'a+')
        se = file(self.stderr, 'a+', 0)
        #重定向标准输入/输出/错误
        os.dup2(si.fileno(), sys.stdin.fileno())
        os.dup2(so.fileno(), sys.stdout.fileno())
        os.dup2(se.fileno(), sys.stderr.fileno())

        #注册程序退出时的函数,即删掉pid文件
        atexit.register(self.delpid)
        pid = str(os.getpid())
        file(self.pidfile,'w+').write("%s\n" % pid)

    def delpid(self):
        os.remove(self.pidfile)
    def start(self):
        """
        Start the daemon
        """
        # Check for a pidfile to see if the daemon already runs
        try:
            pf = file(self.pidfile,'r')
            pid = int(pf.read().strip())
            pf.close()
        except IOError:
            pid = None

        if pid:
            message = "pidfile %s already exist. Daemon already running?\n"
            sys.stderr.write(message % self.pidfile)
            sys.exit(1)

        # Start the daemon
        self._daemonize()
        self._run()
    def stop(self):
        """
        Stop the daemon
        """
        # Get the pid from the pidfile
        try:
            pf = file(self.pidfile,'r')
            pid = int(pf.read().strip())
            pf.close()
        except IOError:
            pid = None

        if not pid:
            message = "pidfile %s does not exist. Daemon not running?\n"
            sys.stderr.write(message % self.pidfile)
            return # not an error in a restart
        # Try killing the daemon process    
        try:
            while 1:
                os.kill(pid, SIGTERM)
                time.sleep(0.1)
        except OSError, err:
            err = str(err)
            if err.find("No such process") > 0:
                if os.path.exists(self.pidfile):
                    os.remove(self.pidfile)
            else:
                print str(err)
                sys.exit(1)
    def restart(self):
        """
        Restart the daemon
        """
        self.stop()
        self.start()
    def _run(self):
        """
        You should override this method when you subclass Daemon. It will be called after the process has been
        daemonized by start() or restart().
        """

class MyDaemon(Daemon):
    def _run(self):
        while True:
            time.sleep(1)

if __name__ == "__main__":
    daemon = MyDaemon('/tmp/daemon-example.pid')
    if len(sys.argv) == 2:
        if 'start' == sys.argv[1]:
            daemon.start()
        elif 'stop' == sys.argv[1]:
            daemon.stop()
        elif 'restart' == sys.argv[1]:
            daemon.restart()
        else:
            print "Unknown command"
            sys.exit(2)
        sys.exit(0)
    else:
        print "usage: %s start|stop|restart" % sys.argv[0]
        sys.exit(2)


简单解释一下,整个类实现的功能:
1.进程脱离父进程及终端绑定
2.进程唯一性保证
3.标准输入/输出/错误重定向

附:
源代码下载

OK,就这样~

Pingbacks

  1. MailService:使用守护进程发送邮件 - 弱类型 on #

    [...] Daemon部分在网上搜一下,有现成可用的示例。比如vimer的blog上的这一篇,我这里基本就是套用这个模式的。中间出了一些小问题,主要是对python类中的_和__认识不清楚造成的,_相当于protect,子类可以访问,__相当于private,子类是继承不了的。其它的没有什么问题,然后就是在run函数中写自己的逻辑了,这里我们用到了子进程池,python在multiprocessing包中提供了Pool来帮助我们实现这一点。需要注意的是,给子进程的函数句柄不能是类内部的,最好是使用def funcName(param)方式定义的,这里涉及了一个pickle问题,具体可以查一下python的手册,我看得也不是很明白,只知道是和函数的存储以及多进程访问有关。子进程池的简单示例如下: [...]

Pingbacks已打开。

Trackbacks

引用地址

评论

  1. GlacJAY

    GlacJAY on #

    在 PyPI 里面有现成的库的,我用过的是 python-daemon 。

    Reply

    1. Dante

      Dante on #

      去看了一下,果然是有现成的库的,多谢~~

      Reply

  2. 雨碎江南

    雨碎江南 on #

    ...守护进程...
    话说我正在和sbin/init作斗争.

    Reply

  3. 可可火山

    可可火山 on #

    对于这个事情我看了 《让进程在后台可靠运行的几种方法》 有了比较全面的理解
    http://www.ibm.com/developerworks/cn/linux/l-cn-nohup/

    平时工作都用screen。
    python刚开始,学习了。python库太多?有标准么

    Reply

    1. Dante

      Dante on #

      嗯,去看了一下那个链接,确实讲的更深刻一些。。。
      python的话,pypi上面的库应该就算比较正式的了~

      Reply

  4. blankyao

    blankyao on #

    博主是啥部门的?好像是同事,呵呵

    Reply

    1. Dante

      Dante on #

      呵呵,互联网的~~看了你的资料,应该也是互联网的吧~~

      Reply

  5. GuoJing

    GuoJing on #

    不错,这个得支持一下。正准备写python后台运行的程序呢。

    Reply

    1. Dante

      Dante on #

      呵呵,羡慕啊,在douban可以用这么优雅的语言写程序~

      Reply

  6. yogoloth

    yogoloth on #

    其实关键就是setsid

    Reply

    1. Dante

      Dante on #

      嗯,不过考虑了更多的细节~
      把unix环境编程所要求的5点都实现了。

      Reply

  7. Zealot Ke

    Zealot Ke on #

    start时建议加上这个检查:os.kill(pid, 0),确认pid对应的进程确实存在,没有异常死掉。
    p.s. man 2 kill
    "If sig is 0, then no signal is sent, but error checking is still performed; this can be used to check for the
    existence of a process ID or process group ID."

    Reply

    1. 依云

      依云 on #

      原来用 kill 就可以判断进程是否存在啊~学习了~~

      Reply

      1. 妞妞

        妞妞 on #

        同样学习了

        Reply

    2. Dante

      Dante on #

      的确的确,包括线程也是可以通过:
      pthread_kill_err = pthread_kill(*it,0);
      来判断是否死亡的~
      if(pthread_kill_err == ESRCH)
      {
      ERROR_LOG("ID为0x%x的线程不存在或者已经退出。\n",(unsigned int)*it);
      }

      Reply

  8. cc

    cc on #

    nohup 启动 python 脚本为 daemon

    会不会导致
    no job control in this shell
    bg, fg ...
    无法使用呢?

    Reply

  9. cc

    cc on #

    我意思是:
    nohup 会不会没有完全脱离当前终端 ...
    导致终端占用,从而导致 no job control

    Reply

    1. Dante

      Dante on #

      应该是完全脱离了的,你可以ps -ef 看进程的状态,是没有tty的。

      Reply

      1. cc

        cc on #

        开机自启动 /etc/init.d/test
        完全脱离 tty

        开机后手动启动没有脱离,总有tty or pts/*

        Reply

  10. 包菜兄

    包菜兄 on #

    我怎么觉得这样的叫做脱离终端进程,没有守护呀。

    Reply

发表评论