kubernetes集群删除pod后长时间处于Terminating状态的案例

JustHaveTry

2020-07-17

背景：

预生产环境，使用kubeadm部署的HA集群如下。

NAME STATUS ROLES AGE VERSION
sbfk1test Ready master 37d v1.15.2
sbfk2test Ready master 37d v1.15.2
sbfk3test Ready <none> 37d v1.15.2

现象：

删除pod后，长时间处于Terminating状态，几分钟到十几分钟不等。

使用kubectl delete pod --force --grace-period=0 <PODNAME>来强制删除。

定位：

1、Terminating慢的定位，看了很多文档，都没有头绪。在网上看到一个疑似的案例，资源使用率较高，导致kubectl在销毁资源的时候被stuck。

2、查看两台宿主机的资源使用，总体资源比较空闲，但是看到etcd的进程cpu大于50%。

推测可能跟etcd的性能或者集群配置更新有关系，于是查看etcd的pod的日志，看到sbfk2test的etcd一直在刷：error "tls: \"<IP地址A>\" does not match any of DNSNames [\"sbfk1test\" \"localhost\"]

这时我想到自己制作证书的时候，地址写了IP地址A，而etcd是启用了双向认证的，sbfk1test请求sbfk2test的etcd-api时报错client证书问题。

到这里，我就知道自己配置etcd集群的证书是有问题的。

验证：

修改/etc/kubernetes/manifests/etcd.yaml的：

--client-cert-auth=true 改为 --client-cert-auth=false

--peer-client-cert-auth=true 改为 --peer-client-cert-auth=false

把client的认证改为false，发现两个master的etcd的pod都不报错了，查看进程消耗，发现etcd的cpu使用率小于5%。

解决：

制作新的etcd证书，且该证书支持多域名或ip地址，把kube-apiserver地址、etcd的主机名都加进去。

pod etcd kubernetes

JustHaveTry

0 关注 0 粉丝 0 动态

关注关注

从零开始了解 Kubernetes

Kubernetes 已经成为容器编排领域的王者，它是基于容器的集群编排引擎，具备扩展集群、滚动升级回滚、弹性伸缩、自动治愈、服务发现等多种特性能力。本文将带着大家快速了解 Kubernetes ，了解我们谈论 Kubernetes 都是在谈论什么。从宏

breezegao 2020-07-02

两款超好用的Kubernetes实时日志查看工具

通常情况下，Kubernetes 环境下的应用日志都需要通过日志系统来进行收集，比如：Filebeat + ElasticSearch + Kibana 的组合来实现。虽然这一组合的功能相当强大，但是在一些比较简陋的测试集群中，或者不具备浏览器条件的自动化

远远的山 12评论 2020-11-09

Kubernetes上对应用程序进行故障排除的6个技巧

从 Docker 迁移到 Docker Swarm，再到 Kubernetes，然后处理了多年来的所有各种 API 更改之后，我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下我认为最有用的5条故障排除技巧，以及一些其他的使用技巧。这个命令如此重

kaidiphp 10评论 2020-10-13

首次部署 Kubernetes 应用，总会忽略这些事

根据我的个人经验，大多数人似乎倾向于通过 Helm 或者手动方式将应用程序甩给 Kubernetes，之后就坐等每天轻松调用的美好生活。但在 GumGum 公司的实践当中，我们体会到 Kubernetes 应用的一系列“陷阱”，也希望把这些陷阱与大家分享，

JustHaveTry 2020-09-29

Kubernetes如何为应用程序提供网络和存储？

网络组件支持pod到pod、节点到pod、pod到服务以及外部客户端到服务的通信。Kubernetes遵循用于实现网络服务的插件模式。Kubenet是默认的网络插件，配置简单。它通常与为节点之间或单节点环境中的通信设置路由规则的云提供商一起使用。Kuber

cloudvtech 2020-09-18

第7章：Kubernetes存储

创建一个空卷，挂载到Pod中的容器。Pod删除该卷也会被删除。什么样的适合在pod中运行多个容器?command: ["bash","-c","for i in {1..100};do echo $i &g

BigDataMining 2020-08-21

一个小需求，自动重启k8s集群中日志不刷新的POD

日常工作中，所有项目都不是完美的，笔者就经常遇到这种情况，pod状态是running，但是程序却没有响应。发生这种情况的原因有很多种，有可能是因为k8s健康检查的原因，比如使用ps检查进程;或者是程序内部死循环，但是不退出;再或者网络闪断，程序无法重连等等

XiaoMuFireAnt 2020-09-02

18、Secret

Secret 解决了密码、token、密钥等敏感数据的配置问题，而不需要把这些敏感数据暴露到镜像或者 Pod Spec中。Secret 可以以 Volume 或者环境变量的方式使用。Opaque：base64编码格式的Secret，用来存储密码、密钥等。使

IT兄弟团 2020-08-01

深入掌握K8S Pod

Pod是k8s中最小的调度单元，包含了一个“根容器”和其它用户业务容器。如果你使用过k8s的话，当然会了解pod的基本使用，但是为了更好的应用，你需要深入了解pod的配置、调度、升级和扩缩容等。本文将会更进一步的介绍pod。pod包含一个或多个相对紧密耦合

akcsdno 2020-07-21

React Native pod install错误 SDK \"iphoneos\" cannot be located

给Xcode命令行工具指定路径。//查看所有可用sdk

孝平 2020-07-18

Kubernetes-12：Secret介绍及演示

　　Secret解决了密码、token、密钥等敏感数据的配置问题，而不需要把这些敏感数据暴露到镜像或者Pod Spec中，可以以Volume或者环境变量的方式使用。　　Opaque：base64编码格式的Secret，用来存储密码、秘钥等。只要与Kuber

kjh00abc 2020-07-08

Kubernetes之POD、容器之间的网络通信

Kubernetes是开源的容器集群管理系统，可以实现容器集群的自动化部署、自动扩缩容、维护等功能。它既是一款容器编排工具，也是全新的基于容器技术的分布式架构领先方案。在Docker技术的基础上，为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等功

Dxiaoru 2020-07-06

kubernetes(六) 基于kubeadm构建高可用k8s集群

k8s如果向替换CRI的话，只需要讲POD使用相关的容器技术封装即可。service：实现了从宿主机外层访问k8s内部不同的容器的访问方式，还实现了pod的动态发现；因此可以说Service是k8s内部的负载均衡器。作为集群内部的控制中心，负责集群内部的

xiunai 2020-06-28

Kubernetes（k8s）的RC(Replication Controller)副本控制器

　　应用托管在kubernetes之后，kubernetes需要保证应用能够持续运行，这是RC的工作内容，它会确保任何时间kubernetes中都有指定数量的Pod在运行。RC除了保证Pod高可用之外，还提供了更高级的特性，比如滚动升级，升级回滚等等。

薛正华 2020-06-21

Kubernetes（k8s）的Service资源

答：运行在docker中的业务，想要被外界访问，我们需要为它做端口映射才能被访问，那么运行在k8s中的容器，为什么不能直接为它做端口映射呢？在K8s中Node端口映射不可以直接映射到我们的Pod的Ip地址上面，此时K8s引入了Service,VIP地址段的

JustHaveTry 2020-06-21

Kubernetes 0-1 Pod中的livenessProbe和readinessProbe解读

K8S对Pod的健康状态可以通过两类探针来检查：livenessProbe和readinessProbe，kubelet通过定期执行这两类探针来诊断容器的健康状况。存活指针，判断Pod是否健康，可以理解为健康检查。当我们执行kubectl get pods

丽丽 2020-06-14

Kubernetes:深入了解Deployment

kuberntes部署应用最常用的一个控制器，Deployment可以部署无状态应用，像web、api就是无状态应用。pod对象作为一个最小的调度单元，很少直接创建，一般使用控制器来完成一个应用的部署，控制器在集群上管理和运行容器的对象，这个对象是高级的，

shurenyun 2020-06-14

kubernetes入门到实战（八）Pod健康检查机制

应用在运行过程中难免会出现错误，如程序异常，软件异常，硬件故障，网络故障等，kubernetes提供Health Check健康检查机制，当发现应用异常时会自动重启容器，将应用从service服务中剔除，保障应用的高可用性。readiness probes

JustHaveTry 2020-06-12

简单5步，轻松debug K8S服务！

在Kubernetes中，服务是一个核心概念。在本文中，将介绍如何调试K8S服务，这些服务是由多个Pod组成的工作负载的抽象接口。在我们深入探索debug方法之前，我们先简单回顾一下网络，这是Kubernetes服务的基础。在一个pod中的容器共享相同的网

xingyuzhe 2020-06-10

Pod和容器的生命周期管理

Pod由一组应用容器组成，其中包含共有的环境和资源约束。在 CRI里，这个环境被称为PodSandbox。Kubernetes有意为容器运行时留下一些发挥空间，它们可以根据自己的内部实现来解释PodSandbox。对于Hypervisor类的运行时，P

lantingyue 2020-06-10

安科网

kubernetes集群删除pod后长时间处于Terminating状态的案例

JustHaveTry

JustHaveTry

相关推荐

从零开始了解 Kubernetes

两款超好用的Kubernetes实时日志查看工具

Kubernetes上对应用程序进行故障排除的6个技巧

首次部署 Kubernetes 应用，总会忽略这些事

Kubernetes如何为应用程序提供网络和存储？

第7章：Kubernetes存储

一个小需求，自动重启k8s集群中日志不刷新的POD

18、Secret

深入掌握K8S Pod

React Native pod install错误 SDK \"iphoneos\" cannot be located

Kubernetes-12：Secret介绍及演示

Kubernetes之POD、容器之间的网络通信

kubernetes(六) 基于kubeadm构建高可用k8s集群

Kubernetes（k8s）的RC(Replication Controller)副本控制器

Kubernetes（k8s）的Service资源

Kubernetes 0-1 Pod中的livenessProbe和readinessProbe解读

Kubernetes:深入了解Deployment

kubernetes入门到实战（八）Pod健康检查机制

简单5步，轻松debug K8S服务！

Pod和容器的生命周期管理

JustHaveTry