今天发文比较多,哈,实在是觉得知识就该及时沉淀下来,时间长了难免记忆会模糊。 OK,直接切入正题,之前http://t.vimer.cn上提过正在开发的fuload压力测试框架,由于是想拿python做胶水语言,所以不可避免的涉及到了进程间通信的问题。 简单来说就是,一个python写的主进程与多个c写的处理进程通信的问题。主进程启动之后,会启动多个c的处理进程,主进程会对处理进程发送数据,并控制处理进程。 这种情况在server的编写中比较常见,为了解耦一般会将接受数据的进程与处理进程分开,在c中的实现一般是主进程先fork出子进程,然后在子进程中调用exec将自身替换为处理进程,进程id不变。这样主进程即可拿到所有的子进程id进行统一管理。 python当然也可以通过这种方式来实现,fork+execv即可完美重现,但是这可是无所不能的python呀,是否有更好的方式呢? 有的!python2.4之后引入了subprocess模块,通过它,我们将不再需要繁琐的调用fork,execv等,其主要函数如下:
class subprocess.Popen(args, bufsize=0, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, close_fds=False, shell=False, cwd=None, env=None, universal_newlines=False, startupinfo=None, creationflags=0)
#args需要是一个字符串,或者包含程序参数的列表。要执行的程序一般就是这个列表的第一项,或者是字符串本身。但是也可以用executable参数来明确指出。当executable参数不为空时,args里的第一项仍被认为是程序的“命令名”,不同于真正的可执行文件的文件名,这个“命令名”是一个用来显示的名称,例如执行*nix下的 ps 命令,显示出来的就是这个“命令名”。
#在*nix下,当shell=False(默认)时,Popen使用os.execvp()来执行子程序。args一般要是一个列表。如果args是个字符串的话,会被当做是可执行文件的路径,这样就不能传入任何参数了。
详细可参考:http://luy.li/2010/04/14/python_subprocess/
我们来直接看一下我编写的示例代码,主程序(test_signal_send.py):
import subprocess
from subprocess import Popen
import signal
childs = []
def handler(signo, frame):
global childs
for child in childs:
try:
child.send_signal(signal.SIGINT)
except:
pass
def main():
global childs
for i in range(0,10):
p = Popen(["./test_signal_recv"])
childs.append(p)
signal.signal(signal.SIGINT, handler)
for child in childs:
child.send_signal(signal.SIGUSR1)
for child in childs:
child.wait()
if __name__ == "__main__":
main()
然后是处理进程(test_signal_recv.cpp)(没有在ouch中直接printf的原因是由于printf在信号处理函数中调用不安全,详细可以参考unix网络编程):
#include <error.h>
#include <errno.h>
#include <sys/time.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <poll.h>
#include <sys/epoll.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <fcntl.h>
#include <strings.h>
#include <string.h>
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
#include <signal.h>
int getsig = 0;
void ouch(int sig)
{
getsig = 1;
}
int main(int argc, const char *argv[])
{
signal(SIGUSR1,ouch);
while(1)
{
printf("hello world\n");
if (getsig == 1)
{
printf("get signal\n");
getsig = 0;
}
sleep(1);
}
return 0;
}
通过
python test_signal_send.py
运行,在另一个窗口中输入:
ps x
终端结果如下:
PID TTY STAT TIME COMMAND
2563 ? S 0:00 sshd: dantezhu@pts/0
2564 pts/0 Ss 0:00 -bash
2778 ? S 0:00 sshd: dantezhu@pts/1
2779 pts/1 Ss 0:00 -bash
3172 pts/0 S+ 0:00 python test_signal_send.py
3173 pts/0 S+ 0:00 ./test_signal_recv
3174 pts/0 S+ 0:00 ./test_signal_recv
3175 pts/0 S+ 0:00 ./test_signal_recv
3176 pts/0 S+ 0:00 ./test_signal_recv
3177 pts/0 S+ 0:00 ./test_signal_recv
3178 pts/0 S+ 0:00 ./test_signal_recv
3179 pts/0 S+ 0:00 ./test_signal_recv
3180 pts/0 S+ 0:00 ./test_signal_recv
3181 pts/0 S+ 0:00 ./test_signal_recv
3182 pts/0 S+ 0:00 ./test_signal_recv
3185 pts/1 R+ 0:00 ps x
在主进程的窗口上输入CTRL+C,再查看进程情况:
PID TTY STAT TIME COMMAND
2563 ? S 0:00 sshd: dantezhu@pts/0
2564 pts/0 Ss+ 0:00 -bash
2778 ? S 0:00 sshd: dantezhu@pts/1
2779 pts/1 Ss 0:00 -bash
3187 pts/1 R+ 0:00 ps x
OK,这样主进程启动处理进程的问题就解决了,怎么样,简单吧!
接下来是数据通信的问题。 c处理进程间通信的常用方式相信大家都知道:共享内存,消息队列,信号量,管道,信号,socket,文件mmap等。而python中只支持上述列表中的管道,信号,socket,文件mmap。 具体的筛选过程就不说了,只说最终选择的方案是信号+文件mmap的方式。主进程发送给处理进程信号通知数据可读,处理进程从文件mmap中读取数据。 其实前面的例子中已经使用了信号,所以我们主要说一下mmap就行。python中是提供了mmap模块的,我们直接调用即可。
写文件mmap(python)(test_mmap_write.py):
import mmap
wtext = 'www.vimer.cn'
f = file('hello.txt','w+b')
f.truncate(len(wtext))
map = mmap.mmap(f.fileno(), len(wtext))
map.write(wtext)
map.flush()
读文件mmap(c)(test_mmap_read.cpp):
#include <iostream>
#include <string>
#include <vector>
#include <set>
#include <map>
#include <error.h>
#include <errno.h>
#include <sys/time.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <poll.h>
#include <sys/epoll.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <fcntl.h>
#include <strings.h>
#include <string.h>
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
#include <sys/mman.h>
using namespace std;
unsigned long get_file_size(const char *filename)
{
struct stat buf;
if(stat(filename, &buf)<0)
{
return 0;
}
return (unsigned long)buf.st_size;
}
int map_read()
{
char file_name[] = {"hello.txt"};
int length = get_file_size(file_name);
int fd = open(file_name, O_RDWR | O_CREAT, 0644);
if(fd < 0) return -1;
char *buf = (char *) mmap(0, length, PROT_READ, MAP_SHARED, fd, 0);
if(buf == NULL)
{
close(fd);
return -1;
}
close(fd);
printf("%s\n",buf);
}
int main(int argc, const char *argv[])
{
map_read();
return 0;
}
先运行:
python test_mmap_write.py
然后运行./test_mmap_read,输出如下:
www.vimer.cn
OK,完美解决~~这些代码都放到了fuload工程中,大家可以到https://fuload.googlecode.com/svn/trunk/src/slave/test/查看源码。
wecing on #
虽然在下是emacser,但是这篇文章真的帮了我大忙了……泪目泪目。
Reply
Dante on #
哈哈,喜欢用什么工具并不是分水岭嘛~~~
Reply
wecing on #
对啊……
可是最后还是决定用socket了,因为要操作二进制的数据流……
Reply
Games on #
只来学习。不说话
Reply