服务器TIME_WAIT和CLOSE_WAIT详解和解决办法

服务器TIME_WAIT和CLOSE_WAIT详解和解决办法,第1张

在日常的服务器维护中,会经常用到如下命令。
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

它会显示例如下面的信息:
TIME_WAIT 689
CLOSE_WAIT 2
FIN_WAIT1 1
ESTABLISHED 291
SYN_RECV 2
LAST_ACK 1

常用的三个状态是:ESTABLISHED表示正在通信 、TIME_WAIT表示主动关闭、CLOSE_WAIT表示被动关闭。

如果服务器出现了异常,很大的可能是出现了以下两种情况:

我们也都知道Linux系统中分给每个用户的文件句柄数是有限的,而TIME_WAIT和CLOSE_WAIT这两种状态如果一直被保持,那么意味着对应数目的通道(此处应理解为socket,一般一个socket会占用服务器端一个端口,服务器端的端口最大数是65535)一直被占用,一旦达到了上限,则新的请求就无法被处理,接着就是大量Too Many Open Files异常,然后tomcat、nginx、apache崩溃。。。

下面来讨论这两种状态的处理方法,网络上也有很多资料把这两种情况混为一谈,认为优化内核参数就可以解决,其实这是不恰当的。优化内核参数在一定程度上能解决time_wait过多的问题,但是应对close_wait还得从应用程序本身出发。

这种情况比较常见,一般会出现在爬虫服务器和web服务器(如果没做内核参数优化的话)上,那么这种问题是怎么产生的呢?

从上图可以看出time_wait是主动关闭连接的一方保持的状态,对于爬虫服务器来说它自身就是客户端,在完成一个爬取任务后就会发起主动关闭连接,从而进入time_wait状态,然后保持这个状态2MSL时间之后,彻底关闭回收资源。这里为什么会保持资源2MSL时间呢?这也是TCP/IP设计者规定的。

TCP要保证在所有可能的情况下使得所有的数据都能够被正确送达。当你关闭一个socket时,主动关闭一端的socket将进入TIME_WAIT状 态,而被动关闭一方则转入CLOSED状态,这的确能够保证所有的数据都被传输。当一个socket关闭的时候,是通过两端四次握手完成的,当一端调用 close()时,就说明本端没有数据要发送了。这好似看来在握手完成以后,socket就都可以处于初始的CLOSED状态了,其实不然。原因是这样安 排状态有两个问题, 首先,我们没有任何机制保证最后的一个ACK能够正常传输,第二,网络上仍然有可能有残余的数据包(wandering duplicates),我们也必须能够正常处理。

TIMEWAIT就是为了解决这两个问题而生的。

再引用网络中的一段话:

time_wait问题可以通过调整内核参数和适当的设置web服务器的keep-Alive值来解决。因为time_wait是自己可控的,要么就是对方连接的异常,要么就是自己没有快速的回收资源,总之不是由于自己程序错误引起的。但是close_wait就不一样了,从上图中我们可以看到服务器保持大量的close_wait只有一种情况,那就是对方发送一个FIN后,程序自己这边没有进一步发送ACK以确认。换句话说就是在对方关闭连接后,程序里没有检测到,或者程序里本身就已经忘了这个时候需要关闭连接,于是这个资源就一直被程序占用着。这个时候快速的解决方法是:

注:
直到写这篇文章的时候我才完全弄明白之前工作中遇到的一个问题。程序员写了爬虫(php)运行在采集服务器A上,程序去B服务器上采集资源,但是A服务器很快就发现出现了大量的close_wait状态的连接。后来手动检查才发现这些处于close_wait状态的请求结果都是404,那就说明B服务器上没有要请求的资源。

下面引用网友分析的结论:
服 务器A是一台爬虫服务器,它使用简单的>爬虫脑缺陷是指在编写爬虫程序时出现的一种错误,通常是由于程序设计不当或代码实现有误而导致的。以下是爬虫脑缺陷的几个常见表现形式:
1 内存泄漏:爬虫程序需要频繁地请求网络数据,并将其存储在内存中。如果程序中没有正确地释放不再需要的内存,就会导致内存泄漏,最终导致程序崩溃或系统崩溃。
2 死循环:在编写爬虫程序时,可能会出现死循环的情况。这种情况通常是由于程序中的逻辑错误或循环条件设置错误导致的,如果没有及时发现和修复,程序将一直运行下去,占用系统资源,甚至导致系统崩溃。
3 超时和阻塞:网络爬虫程序需要频繁地请求网络数据,如果程序设计不当,可能会出现超时和阻塞的情况。这种情况通常是由于网络请求过度、线程阻塞等原因导致的,如果没有及时发现和处理,会导致请求失败或程序崩溃。
4 重复请求:在爬虫程序中,可能会出现重复请求的情况,这种情况通常是由于程序中的逻辑错误或数据处理不当导致的。如果没有及时处理,会浪费系统资源,降低程序效率。
为了避免爬虫脑缺陷,编写爬虫程序时需要注意以下几点:
1 设计良好的程序架构,采用模块化的设计思路,降低程序耦合度,便于维护和升级。
2 合理设置请求频率,不要过度请求网络数据,避免被封IP或被服务器屏蔽。
3 采用多线程或异步请求的方式,避免阻塞和超时。
4 对数据进行去重和过滤处理,避免重复请求和数据冗余。
5 定期检查程序,及时发现和修复错误,保证程序稳定运行。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10863764.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-11
下一篇 2023-05-11

发表评论

登录后才能评论

评论列表(0条)

保存