TIME_WAIT 问题的排查
呼叫系统突发的反馈了很多异常问题,总归起来都是网络相关,最后定位跟TIME_WAIT相关 关键字: 网络,TCP,Nginx,TIME_WAIT
情况一
反馈很多的呼叫客户端无法登录,或自动断开通话
由于呼叫客户端是WebSocket方式连接的,所以查看了下服务器,发现大量TIME_WAIT,通过百度优化了一下TCP情况并未改善
排查语句
netstat -ant| grep -i time_wait
后来技术排查发现重连机制存在问题,客户端会存在多个长连接,最后得以解决
情况二
上线管理后台,又有客户反馈情况一,于是再次排查TIME_WAIT发现是API接口占用了很多TIME_WAIT
通过排查后发现原来nginx反向代理会产生这种情况,于是优化了一下nginx的配置
upstream xikew_http {
server 127.0.0.1:8080;
keepalive 16;
}
server {
# 忽略其他配置内容
location /api/ {
proxy_pass http://xikew_http/api/;
proxy_http_version 1.1;
proxy_set_header Connection "";
}
}
实测有效:grinning: