docker swarm mode 下容器重启IP引发的 CLOSE_WAIT 问题

rually

2019-07-01

问题

问题简述

如下图. server docker restart后, client端写入的日志丢失, 并且无报错.
因为不支持时序图, 把时序图代码嵌入在代码里.

```sequence
client->server: log_data
client->server: log_data
server->server: docker restart
server->client: fin
client->server: log_data loss without error
```

tcp state diagram

docker swarm mode 下容器重启IP引发的 CLOSE_WAIT 问题

问题定位过程

为什么卡在CLOSE_WAIT.

看tcp状态转换图, 可以看到client收到了fin, 一直没有recv, 一直卡在CLOSE_WAIT. 和实际的代码是吻合的.
那么, 为什么在server docker restart 引发CLOSE_WAIT后, client发消息仍然不报错呢?
因为:

tcp协议允许client在收到fin后, 继续发送消息.
server 在docker restart后 ip 改变, client还是往原来的ip发送消息, 没有主机通知client rst, 导致消息在系统buffer里积压.

积压信息如下:

root@9eeaefa7fe57:/# netstat -nap | grep 27017 | grep 10.0.0
tcp        1  402 10.0.0.186:62281        10.0.0.16:27017         CLOSE_WAIT  4308/server
root@9eeaefa7fe57:/# netstat -nap | grep 27017 | grep 10.0.0
tcp        1  70125 10.0.0.186:62281        10.0.0.16:27017         CLOSE_WAIT  4308/server

此时, 在elixir socket接口层面来看, 不管socket的状态, 还是发送, 都是ok的.

iex(client@client.)25> socket |> :inet.port
{:ok, 57395}
iex(client@client.)26> socket |> :gen_tcp.send("aaa")
:ok

如果主动close, 则会进入LAST_ACK状态

iex(client@client.)27> socket |> :gen_tcp.close()    
:ok

root@9eeaefa7fe57:/# netstat -nap | grep 27017 | grep 10.0.0
tcp        1  70126 10.0.0.186:62281        10.0.0.16:27017         LAST_ACK    -

CLOSE_WAIT的恢复

如果代码还是只发不收. 是检测不到CLOSE_WAIT的. 显然, 应用层心跳是一个解决方案. 那么, 不使用心跳, 只发不收的情况下, 什么时候才能检测到错误呢?

send buffer 满
tcp keepalive, 默认情况下需要2小时才能检测到连接错误. 见linux keepalive探测对应用层socket api的影响

docker socket

rually

0 关注 0 粉丝 0 动态

关注关注

快速制作Redis Docker镜像

现在容器化已经是趋势，制作镜像也是我们的基础工作。镜像越小，部署起来越方便。在这个方面，轻巧的Linux发行版本就是一个很好的选择，这里我们选择alpine linux 。目前最新版本是3.12.1。官方很友好的提供了minirootfs的包，这个包就是为

王道革 2020-11-25

Docker 文档编译 - 创建标签（Tab）页

标签页使用的是 Bootstrap CSS/JS，因此请参考相关的文档来获得有关标签页使用的更多有关内容和信息。针对标准的水平标签页，你可以拷贝和粘贴下面的表单内容，在上面的表单内容中关键的地方在href="#id"和id="

bwyyziq 2020-11-22

Ubuntu 安装Docker

Unbutu系统上安装Docker服务，为保证docker服务的运行未定，需要使用与之相匹配的docker版本，使用命令。若看到上述信息，表明docker安装成功！默认情况下，docker从hub上下载需要安装的进行，囿于这些hub位于国外，下载速度缓慢，

pigsmall 2020-11-19

Docker CentOS 安装方法

绝大部分用户使用设置 Docker 的仓库，然后从设置成功后的仓库进行安装。为了更加容易进行安装和升级任务，Docker 的官方推荐使用这种安装方式来进行安装。这种方法主要针对一些系统不具有联网环境，你需要下载后进行安装。在一些测试和部署环境中，一些用

changecan 2020-11-19

docker CPU限制的实现

2）例如：如果主机有2个CPU，设置--cpus="1.5"，则可以报称容器醉倒容纳一半的CPU，相当于设置--cpu-period="100000"和--cpu-quota="150000".

helloWorldAndYou 2020-11-16

Docker部署nginx实现过程图文详解

docker.io/redis latest 1e70071f4af4 6 weeks ago 106.7 MB. [root@localhost my.Shells]# docker pull nginx //下载nginx

nginxs 2020-11-14

Docker服务器存储资源池不足的问题解决

最近在执行 Docker 运行命令启动镜像时候，无法正常执行 Docker 启动镜像命令，提示了如下错误信息：。Error: Error response from daemon: devmapper: Thin Pool has 163051 free

红石丶 2020-11-13

用docker运行postgreSQL的方法步骤

drwx------ 19 polkitd ssh_keys 4096 Jan 14 08:40 .drwxr-xr-x 3 root root 4096 Jan 14 08:33 ..drwx------ 5 polkitd ssh_keys 40

WanKaShing 2020-11-12

docker之docker-machine用法详解

docker-machine 是docker官方提供的docker管理工具。环境win下面安装的virtualbox，virtualbox安装的centos7，网络模式NAT+hostonly. Error with pre-create check: &

yangkang 2020-11-12

利用 Docker 构建简单的 java 开发编译环境的方法详解

目前 Java 语言的版本很多，除了常用的 Java 8，有一些遗留项目可能使用了 Java 7，也可能有一些比较新的的项目使用了 Java 10 以上的版本。如果想切换自己本地的 Java 开发环境，折腾起来还是需要花费一些时间的，并且日后在不同版本间切

滴水穿石点石成金 2020-11-12

Docker如何给Springboot项目动态传参的实现方法

最近有些初学Docker的朋友问到，想通过docker-compose.yml来动态给微服务传参，而不是每次都要在项目配置文件硬编码，然后构建服务镜像，最后打包发布经过一些列流程才能更新配置，那能不能直接通过docker-compose.yml里把一些配置

张荣珍 2020-11-12

详解SpringBoot项目docker环境运行时无限重启问题

可能是我开始处理问题的思路不对，现在描述问题可能也有点乱，但是里面可能的处理方式希望能帮到遇到我这个坑的人。描述：springboot项目，docker镜像里面运行，看docker的日志，项目启动成功后，隔了一分钟左右他就自动重新启动，然后造成网站接口访问

wuxunanjing 2020-11-11

关于docker部署的jenkins跑git上的程序的问题

具体可参考这篇文章。解决就是把指定分支按照下图的设置，就是代表any分支的意思。

MartellJenkins 2020-11-23

Docker使用Portainer搭建可视化界面的方法

Portainer是Docker的图形化管理工具，提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作、事件日志显示、容器控制台操作、Swarm集群和服务等集中管理和操作、登录用户管理和控制等功能。功能十分全面，基本能满足中小型单位对容器管理的

魅惑青花瓷 2020-11-11

详解使用阿里云镜像仓库构建国外Docker镜像

在日常使用 Docker 或 K8S 的过程中，经常会需要到国外的网站中下载镜像，但是有些网站在国内是无法访问的。对于这个问题可以使用阿里云提供的镜像仓库进行下载，然后 pull 到本地并修改 tag 来实现。例如在使用 K8S 部署 Istio 时，需要

lihongtai 2020-11-09

docker容器与宿主机的数据交互方式总结

在生产环境中使用 Docker ，往往需要对数据进行持久化，或者需要在多个容器之间进行数据共享，这必然涉及容器的数据管理操作。docker cp :用于容器与主机之间的数据拷贝。当删除Docker容器，并通过该镜像重新启动时，之前的更改将会丢失。在Dock

yangkang 2020-11-09

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

Linux初始化和一些常用环境的搭建是一个虽简单但费时的工作，尤其是你的Linux由于某种不可控的因素宕机了，这意味着你又要从头开始部署一遍环境，有些令人抓狂，因此我有了搭建这个Linux初始化脚本库的想法，不管小白还是大佬，只需一键运行，然后喝杯咖啡，环

worldsnow 2020-11-06

如何进入、退出docker的container实现

Docker的镜像称为image，容器称为container。对于Docker来说，image是静态的，类似于操作系统快照，而container则是动态的，是image的运行实例。比如，有一个image名称为ubuntu，那么比如现在我们启动这个image

MichaelJScofield 2020-11-06

详解docker pull 下来的镜像都存到了哪里

docker pull 下来的命令都默认存在/var/lib/docker/文件夹下。正好和docker images的内容一致。可以看到上面 repositories.json 文件中记录的就是已拉取的镜像信息。

TaoTaoFu 2020-11-06

Docker结合.Net Core的初步使用教程

Docker是一项比较流行的容器化技术，可以让开发者将应用以及应用依赖的环境，依赖包一起打包到容器中，然后部署容器到生产环境就可以了，解决了应用程序部署到不同服务器环境带来的问题，实现了“一次构建，处处运行”。官方为我们提供了针对不同系统的Docker版本

ppppfly 2020-10-23

安科网

docker swarm mode 下容器重启IP引发的 CLOSE_WAIT 问题

rually

问题

问题简述

tcp state diagram

问题定位过程

为什么卡在CLOSE_WAIT.

CLOSE_WAIT的恢复

rually

相关推荐

快速制作Redis Docker镜像

Docker 文档编译 - 创建标签（Tab）页

Ubuntu 安装Docker

Docker CentOS 安装方法

docker CPU限制的实现

Docker部署nginx实现过程图文详解

Docker服务器存储资源池不足的问题解决

用docker运行postgreSQL的方法步骤

docker之docker-machine用法详解

利用 Docker 构建简单的 java 开发编译环境的方法详解

Docker如何给Springboot项目动态传参的实现方法

详解SpringBoot项目docker环境运行时无限重启问题

关于docker部署的jenkins跑git上的程序的问题

Docker使用Portainer搭建可视化界面的方法

详解使用阿里云镜像仓库构建国外Docker镜像

docker容器与宿主机的数据交互方式总结

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

如何进入、退出docker的container实现

详解docker pull 下来的镜像都存到了哪里

Docker结合.Net Core的初步使用教程

rually