标签归档:time_wait

RSS feed of time_wait

最后更新于 .

最近需要上线的逻辑server由于需要与大量的后台server交互,今天突然发现有大量的close_wait产生,于是仔细研究了一下:
首先我们知道,如果我们的服务器程序处于CLOSE_WAIT状态的话,说明套接字是被动关闭的!
因为如果是CLIENT端主动断掉当前连接的话,那么双方关闭这个TCP连接共需要四个packet:

Client ---> FIN  ---> Server
Client <--- ACK  <--- Server


这时候Client端处于FIN_WAIT_2状态;而Server 程序处于CLOSE_WAIT状态。

Client <--- FIN  <--- Server


这时Server 发送FIN给Client,Server 就置为LAST_ACK状态。

Client ---> ACK  ---> Server


Client回应了ACK,那么Server 的套接字才会真正置为CLOSED状态。

Server 程序处于CLOSE_WAIT状态,而不是LAST_ACK状态,说明还没有发FIN给Client,那么可能是在关闭连接之前还有许多数据要发送或者其他事要做,导致没有发这个FIN packet。
通常来说,一个CLOSE_WAIT会维持至少2个小时的时间(这个时间外网服务器通常会做调整,要不然太危险了)。如果有个流氓特地写了个程序,给你造成一堆的CLOSE_WAIT,消耗
你的资源,那么通常是等不到释放那一刻,系统就已经解决崩溃了 ...

最后更新于 .

这周一台新server要上线,突然想起用的是短链接,而且是client端主动断链接,于是就

netstat -lan

看了一下,果然发现大量的TIME_WAIT(9000左右),即系统在发现客户端断掉链接之后的等待状态,解决方法就是打开机器的快速回收。
命令如下:

cd /proc/sys/net/ipv4 
echo 1 > tcp_tw_recycle

过几分钟,在用netstat看一下,果然降到了100左右~~

如果,没有开快速回收就上外网……,结果可以想象了……