解决Kubernetes Pod故障的5个简单技巧

朱培知浅ZLH

2020-04-26

关注关注

即将开播：4月29日，民生银行郭庆谈商业银行金融科技赋能的探索与实践

在很多情况下，你可能会发现Kubernetes中的应用程序没有正确地部署，或者没有正常地工作。今天这篇文章就提供了如何去快速解决这类故障以及一些技巧。

在阅读了这篇文章之后，你还将深入了解Kubernetes的内部机制，另外，我还将与大家分享一些关于自己操作Kubernetes的一些非常有用的技巧。

那么，我们开始吧！

首先，Pod失败的原因一般有两个：

Kubernetes资源配置中的错误，例如在部署（Deployment）和服务（Service）里。
代码中的问题。

在第一种情况下，容器一般不会启动。在后一个实例中，应用程序代码在容器启动后失败。我们将系统地处理每种情况。

在本练习中，我们会使用kubectl来实现与Kubernetes的交互。

技巧1：检查Pod

确认Pod处于运行（Running）状态或准备就绪（Ready）的状态。

kubectl get pods

解决Kubernetes Pod故障的5个简单技巧

如图，一个Pod在等待（Pending）状态9个小时，肯定不是个好事！容器没有启动，我们将会使用技巧2中的describe命令对此进行深入地研究。但，在这里我们强调一下在容器启动失败时发生的其他错误代码。如下：

Imagepullbackoff：

Docker镜像仓库不可访问，部署中指定的镜像名称或版本不正确。

请确保镜像名称是正确的，并且镜像仓库是可访问的以及经过身份验证的（docker login…）。

RunContainerError：

也是一种可能。

原因：

缺少ConfigMap或Secrets。

ContainerCreating：

容器创建时一些组件无法立刻启用，比如持久卷？

在研究其他错误之前，让我们先尝试使用错误的镜像名称启动Pod。

# start Pod from image "ngin".  


# 'web' can be any name, is the name of resulting K8S deployment  

kubectl run web --image=ngin --replicas=1

解决Kubernetes Pod故障的5个简单技巧

最后一行展示了镜像错误

果然，完全不存在的镜像“ngin”导致了ImagePullBackOff错误。使用正确的镜像名称“nginx”就能解决这个问题。

kubectl run temp --image=nginx --replicas=1  

kubectl get pods

解决Kubernetes Pod故障的5个简单技巧

如图，Pod已经起来了。

接下来，这里有一些在容器启动后可能发生的错误。

Crashloopbackoff：

Pod存活检查失败或Docker镜像出错。

例如，Docker CMD即刻退出。

可以用下面的技巧3来检查日志。

注意：

此截图中的“重启（RESTARTS）”列显示了重启的次数。

在这种情况下，你应该会看到一些重启，因为当错误发生时，Kubernetes会反复尝试启动Pod。

如果Pod处于运行（Running）状态，而你的应用程序仍然不能正常工作，请继续技巧3和4。

技巧2：检查和Pod相关的事件

如果你在Pod状态上看到一个错误代码，你可以使用describe命令获得更多信息。这在容器本身没有启动的情况下是很有帮助的。

kubectl describe frontend-65c58c957d-f4cqn

解决Kubernetes Pod故障的5个简单技巧

截图的最后一行表明，由于缺少CPU资源，Pod还没有启动，请参见底部的消息。你可以增加Pod的CPU再重新部署应用程序。

技巧3：检查日志（Log）

现在容器已经启动，可以通过检查日志来查看应用程序是否正常运行。例如，Pod frontend-65c58c957d-bzbg2：

kubectl logs --tail=10 frontend-65c58c957d-bzbg2

解决Kubernetes Pod故障的5个简单技巧

实时滚动查看一个正在运行的日志：

kubectl logs -f frontend-65c58c957d-bzbg2

如果kubectl logs后没有任何输出，试试使用get pod，然后会发现这很有可能是一个新启动的Pod，因此可以尝试检查一些上一次挂掉的Pod的日志。

kubectl logs frontend-65c58c957d-bzbg2 --previous

技巧4：直接在Pod中运行“sh”、“bash”或“ash”

可以进入到Pod内部并运行命令来对应用程序进行故障排除（输入exit即可退出）。

kubectl exec -it frontend-65c58c957d-bzbg2 /bin/sh

技巧5：显示集群级别的事件

Kubernetes在它管理的资源状态发生变化（正常、警告等）时触发对应的事件。这能帮助我们了解背后到底发生了什么。get events命令能提供事件的聚合透视图。

# all events sorted by time.  


kubectl get events --sort-by=.metadata.creationTimestamp# warnings only  


kubectl get events --field-selector type=Warning# events related to Nodes  

kubectl get events --field-selector involvedObject.kind=Node

额外的技巧

这是我最喜欢的技巧！熟练掌握各种命令会使你更有信心在游走在Kubernetes集群中。

首先，输入kubectl可以列出所有kubectl的命令。

接下来，尝试用下面的命令来执行grep调试命令。

kubectl | grep -i -A 10 debugging

解决Kubernetes Pod故障的5个简单技巧

列出可以在Kubernetes上运行的一些基本命令。

kubectl | grep -i -A 5 Basic

解决Kubernetes Pod故障的5个简单技巧

接下来，列出可操作的Kubernetes资源。

kubectl api-resources

解决Kubernetes Pod故障的5个简单技巧

现在可以自己搞一些命令了！你可以选择一个命令（get、describe、explain）并选取一个资源然后运行它！例如，get nodes。所以，再试试别的吧！

虽然有些组合可能并没什么意义，但除了这一点，整个command系统是相当直观和一致的；你可以轻松地编写命令并进行各种探索。

只是千万要小心，不要删除或修改你不希望碰到的对象。

列出Kubernetes命名空间（namespace）：

kubectl get ns

解决Kubernetes Pod故障的5个简单技巧

这样，你可以使用特定的命令来更深入地研究相应的选项或示例。

kubectl get --help  

# see K8S system pods in 'kube-system' namespace!  

kubectl -n kube-system get pods

解决Kubernetes Pod故障的5个简单技巧

正如你所看到的，Kubernetes的命令系统非常容易理解，简单地测试这些命令能让我们学到很多东西。

结论

有了这些，我希望你能在Kubernetes集群中找到并修复Kubernetes资源和代码中的错误。同时我打算接下来再介绍一下Kubernetes服务（Service）和网络的调试。

kubernetes pod 镜像

朱培知浅ZLH

0 关注 0 粉丝 0 动态

关注关注

两款超好用的Kubernetes实时日志查看工具

通常情况下，Kubernetes 环境下的应用日志都需要通过日志系统来进行收集，比如：Filebeat + ElasticSearch + Kibana 的组合来实现。虽然这一组合的功能相当强大，但是在一些比较简陋的测试集群中，或者不具备浏览器条件的自动化

远远的山 12评论 2020-11-09

Kubernetes上对应用程序进行故障排除的6个技巧

从 Docker 迁移到 Docker Swarm，再到 Kubernetes，然后处理了多年来的所有各种 API 更改之后，我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下我认为最有用的5条故障排除技巧，以及一些其他的使用技巧。这个命令如此重

kaidiphp 10评论 2020-10-13

首次部署 Kubernetes 应用，总会忽略这些事

根据我的个人经验，大多数人似乎倾向于通过 Helm 或者手动方式将应用程序甩给 Kubernetes，之后就坐等每天轻松调用的美好生活。但在 GumGum 公司的实践当中，我们体会到 Kubernetes 应用的一系列“陷阱”，也希望把这些陷阱与大家分享，

JustHaveTry 2020-09-29

Kubernetes如何为应用程序提供网络和存储？

网络组件支持pod到pod、节点到pod、pod到服务以及外部客户端到服务的通信。Kubernetes遵循用于实现网络服务的插件模式。Kubenet是默认的网络插件，配置简单。它通常与为节点之间或单节点环境中的通信设置路由规则的云提供商一起使用。Kuber

cloudvtech 2020-09-18

第7章：Kubernetes存储

创建一个空卷，挂载到Pod中的容器。Pod删除该卷也会被删除。什么样的适合在pod中运行多个容器?command: ["bash","-c","for i in {1..100};do echo $i &g

BigDataMining 2020-08-21

如何部署一个Kubernetes集群

在本篇文章中我将以在Mac笔记本中安装两台Ubantu系统的方式，演示如何部署一套具备一个控制节点和一个计算节点的Kubernetes学习集群。要求64位Linux操作系统，且内核版本要求3.10及以上，能满足安装Docker项目所需的要求;机器之间要保持

gracecxj 2020-08-25

6张图带你学懂 Kubernetes Ingress

Kubernetes Ingress 只是 Kubernetes 中的一个普通资源对象，需要一个对应的 Ingress 控制器来解析 Ingress 的规则，暴露服务到外部，比如 ingress-nginx，本质上来说它只是一个 Nginx Pod，然后将

朱培知浅ZLH 2020-11-16

值得推荐的13个 Jenkins 替代方案

Jenkins 是目前最常用的持续集成工具，拥有近 50% 的市场份额，它还是很多技术团队的第一个使用的自动化工具。但是随着自动化领域的持续发展，Jenkins 逐渐暴露出了一些问题，例如缺乏功能、维护问题、依赖关系和扩展问题等等。本文将为大家介绍几个持续

达观数据 2020-11-11

2020年非常值得推荐的7种 Kubernetes 日志管理工具

你可能会奇怪，为什么要为 Kubernetes 的日志管理工具而烦恼？Kubernetes 是容器编排市场的主导者，经常被用来托管微服务。微服务的每个实例都会生成大量的日志事件，并且这些事件很快就会变得难以管理。大多数 Kubernetes 日志管理工具都

JustinChia 2020-11-11

本地环境运行Kubernetes的4种开源工具

Kubernetes作为最重要的开源容器编排平台，用于自动化部署，扩展和管理容器化应用程序。无论遇到什么情况，建议将本地Kubernetes设置为开发环境，因为这种设置可以创建安全，灵活的应用程序部署过程。Minikube是本地Kubernetes应用程序

jingtao 15评论 2020-11-08

五款值得关注的Kubernetes日志监控工具

Kubernetes在容器编排市场中占主导地位，推动企业向微服务演进。微服务的每个实例都会生成大量日志事件，这些事件很快就变得难以管理。但更复杂的是当出现问题时，由于服务之间复杂的交互作用，以及可能的故障模式，导致很难找到根本原因。潜在的问题使得Kuber

大叔比较胖 10评论 2020-10-30

机器学习任务编排工具比较

最近，出现了用于编排任务和数据工作流的新工具。这些工具的数量众多，因此很难选择要使用的工具，也难以理解它们的重叠方式，因此我们决定对一些最受欢迎的工具进行比较。> Airflow is the most popular solution, follo

gracecxj 12评论 2020-10-30

使用Ansible的Kubernetes模块实现容器编排自动化

将 Kubernetes 与 Ansible 结合实现云端自动化。此外，还可以参照我们的 Ansible 的 k8s 模块速查表。Ansible是实现自动化工作的优秀工具，而Kubernetes则是容器编排方面的利器，要是把两者结合起来，会有怎样的效果呢？

onepiecedn 2020-10-29

面试问到了K8S原理，花5分钟来总结下，以后再也不怕了

K8S现在是一项必会的技能，它为软件工程师提供了强大的容器编排能力，模糊了开发和运维之间的边界，让我们开发、管理和维护一个大型的分布式系统和项目变得更加容易，并且每次面试多多少少都会问到，笔者也是被问到了很多次。本文就准备用最短的篇幅来介绍下K8S的工作过

kunyus 11评论 2020-10-28

如何降低开发人员的生产力？

关于开发人员是如何因构造其日常工作而导致生产力下降的文章很多。常见的一个例子是：在一天中安排了很多非必要的会议，因此没人能进入深度聚焦模式。今天，我想研究开发人员生产力方面的最大杀手：配置和设置DevOps工作流程的方式。在几乎所有情况下，我都遇到了一些捷

JustHaveTry 2020-10-27

Windows环境下，如何在Docker里运行SAP UI5应用

本文面向的读者是对Docker技术有一些基本概念，但因为没有测试环境，所以没有动手操作过的朋友们。最近Jerry因为要做一个新的SAP云产品开发，得搭各种开发环境，其中之一就是Docker.当时给出的例子是，在Ubuntu操作系统下用Docker和Kube

锋锋 9评论 2020-10-26

解放开发者！3款工具实现快速K8S开发

时至今日，Kubernetes正在变得越来越重要，不仅仅是运维需要Kubernetes，在开发的世界里Kubernetes也不可或缺。因此能够熟练掌握Kubernetes知识会备受追捧。然而问题是，开发人员是否需要直接上手操作Kubernetes，他们是否

hubanbei00的家园 2020-10-25

什么是CaaS？简化容器管理

随着现代容器化应用陆续被各大企业发现并认可，主要供应商开始提供容器基础设施和管理 "即服务 "只是时间问题。根据Flexera最新的2020年云计算状态报告，容器的使用在全球企业中稳中有升，65%的组织表示他们使用Docker容器，58

谢恩铭 10评论 2020-10-23

Linux基金会开源软件大学技术公开课丨K8s必备技能攻略

随着云开发向容器方面转移，Kubernetes等与容器相关的技术已成为当下技术人员的必备技能。数字时代，许多企业及其所服务的客户正在探寻更灵活、更快交付，且在私有云、混合云，甚至多云环境下都能快速部署或运行的软件及系统。此外，应用Kubernetes还能带

btqszl 10评论 2020-10-21

安科网

解决Kubernetes Pod故障的5个简单技巧

朱培知浅ZLH

即将开播：4月29日，民生银行郭庆谈商业银行金融科技赋能的探索与实践

朱培知浅ZLH

相关推荐

两款超好用的Kubernetes实时日志查看工具

Kubernetes上对应用程序进行故障排除的6个技巧

首次部署 Kubernetes 应用，总会忽略这些事

Kubernetes如何为应用程序提供网络和存储？

第7章：Kubernetes存储

如何部署一个Kubernetes集群

6张图带你学懂 Kubernetes Ingress

推荐4款超好用本地Kubernetes部署工具

值得推荐的13个 Jenkins 替代方案

2020年非常值得推荐的7种 Kubernetes 日志管理工具

本地环境运行Kubernetes的4种开源工具

五款值得关注的Kubernetes日志监控工具

机器学习任务编排工具比较

使用Ansible的Kubernetes模块实现容器编排自动化

面试问到了K8S原理，花5分钟来总结下，以后再也不怕了

如何降低开发人员的生产力？

Windows环境下，如何在Docker里运行SAP UI5应用

解放开发者！3款工具实现快速K8S开发

什么是CaaS？简化容器管理

Linux基金会开源软件大学技术公开课丨K8s必备技能攻略

朱培知浅ZLH