Kubernetes系统架构简介

Kubernetes作为Docker生态圈中重要一员,是Google多年大规模容器管理技术的开源版本,是产线实践经验的最佳表现[G1]。如UrsHölzle所说,无论是公有云还是私有云甚至混合云,Kubernetes将作为一个为任何应用,任何环境的容器管理框架无处不在。正因为如此,目前受到各大巨头及初创公司的青睐,如Microsoft、VMWare、RedHat、CoreOS、Mesos等,纷纷加入给Kubernetes贡献代码。随着Kubernetes社区及各大厂商的不断改进、发展,Kuberentes将成为容器管理领域的领导者。

接下来我们会用一系列文章逐一探索Kubernetes是什么、能做什么以及怎么做。

2.什么是Kubernetes

Kubernetes是Google开源的容器集群管理系统,其提供应用部署、维护、扩展机制等功能,利用Kubernetes能方便地管理跨机器运行容器化的应用,其主要功能如下:

1)使用Docker对应用程序包装(package)、实例化(instantiate)、运行(run)。

2)以集群的方式运行、管理跨机器的容器。

3)解决Docker跨机器容器之间的通讯问题。

4)Kubernetes的自我修复机制使得容器集群总是运行在用户期望的状态。

当前Kubernetes支持GCE、vShpere、CoreOS、OpenShift、Azure等平台,除此之外,也可以直接运行在物理机上。

接下来本文主要从以下几方面阐述Kubernetes:

1)Kubernetes的主要概念。

2)Kubernetes的构件,包括Master组件、Kubelet、Proxy的详细介绍。

3.Kubernetes主要概念

3.1.Pods

Pod是Kubernetes的基本操作单元,把相关的一个或多个容器构成一个Pod,通常Pod里的容器运行相同的应用。Pod包含的容器运行在同一个Minion(Host)上,看作一个统一管理单元,共享相同的volumes和networknamespace/IP和Port空间。

3.2.Services

Services也是Kubernetes的基本操作单元,是真实应用服务的抽象,每一个服务后面都有很多对应的容器来支持,通过Proxy的port和服务selector决定服务请求传递给后端提供服务的容器,对外表现为一个单一访问接口,外部不需要了解后端如何运行,这给扩展或维护后端带来很大的好处。

3.3.ReplicationControllers

ReplicationController确保任何时候Kubernetes集群中有指定数量的pod副本(replicas)在运行,如果少于指定数量的pod副本(replicas),ReplicationController会启动新的Container,反之会杀死多余的以保证数量不变。ReplicationController使用预先定义的pod模板创建pods,一旦创建成功,pod模板和创建的pods没有任何关联,可以修改pod模板而不会对已创建pods有任何影响,也可以直接更新通过ReplicationController创建的pods。对于利用pod模板创建的pods,ReplicationController根据labelselector来关联,通过修改pods的label可以删除对应的pods。ReplicationController主要有如下用法:

1)Rescheduling

如上所述,ReplicationController会确保Kubernetes集群中指定的pod副本(replicas)在运行,即使在节点出错时。

2)Scaling

通过修改ReplicationController的副本(replicas)数量来水平扩展或者缩小运行的pods。

3)Rollingupdates

ReplicationController的设计原则使得可以一个一个地替换pods来rollingupdates服务。

4)Multiplereleasetracks

如果需要在系统中运行multiplerelease的服务,ReplicationController使用labels来区分multiplereleasetracks。

3.4.Labels

Labels是用于区分Pod、Service、ReplicationController的key/value键值对,Pod、Service、ReplicationController可以有多个label,但是每个label的key只能对应一个value。Labels是Service和ReplicationController运行的基础,为了将访问Service的请求转发给后端提供服务的多个容器,正是通过标识容器的labels来选择正确的容器。同样,ReplicationController也使用labels来管理通过pod模板创建的一组容器,这样ReplicationController可以更加容易,方便地管理多个容器,无论有多少容器。

4.Kubernetes构件

Kubenetes整体框架如下图3-1,主要包括kubecfg、MasterAPIServer、Kubelet、Minion(Host)以及Proxy。

图3-1KubernetesHighLevel构件

4.1.Master

Master定义了Kubernetes集群Master/APIServer的主要声明,包括PodRegistry、ControllerRegistry、ServiceRegistry、EndpointRegistry、MinionRegistry、BindingRegistry、RESTStorage以及Client,是client(Kubecfg)调用KubernetesAPI,管理Kubernetes主要构件Pods、Services、Minions、容器的入口。Master由APIServer、Scheduler以及Registry等组成。从下图3-2可知Master的工作流主要分以下步骤:

1)Kubecfg将特定的请求,比如创建Pod,发送给KubernetesClient。

2)KubernetesClient将请求发送给APIserver。

3)APIServer根据请求的类型,比如创建Pod时storage类型是pods,然后依此选择何种RESTStorageAPI对请求作出处理。

4)RESTStorageAPI对的请求作相应的处理。

5)将处理的结果存入高可用键值存储系统Etcd中。

6)在APIServer响应Kubecfg的请求后,Scheduler会根据KubernetesClient获取集群中运行Pod及Minion信息。

7)依据从KubernetesClient获取的信息,Scheduler将未分发的Pod分发到可用的Minion节点上。

下面是Master的主要构件的详细介绍:

图3-2Master主要构件及工作流

3.1.1.MinionRegistry

MinionRegistry负责跟踪Kubernetes集群中有多少Minion(Host)。Kubernetes封装MinionRegistry成实现KubernetesAPIServer的RESTfulAPI接口REST,通过这些API,我们可以对MinionRegistry做Create、Get、List、Delete操作,由于Minon只能被创建或删除,所以不支持Update操作,并把Minion的相关配置信息存储到etcd。除此之外,Scheduler算法根据Minion的资源容量来确定是否将新建Pod分发到该Minion节点。

3.1.2.PodRegistry

PodRegistry负责跟踪Kubernetes集群中有多少Pod在运行,以及这些Pod跟Minion是如何的映射关系。将PodRegistry和CloudProvider信息及其他相关信息封装成实现KubernetesAPIServer的RESTfulAPI接口REST。通过这些API,我们可以对Pod进行Create、Get、List、Update、Delete操作,并将Pod的信息存储到etcd中,而且可以通过Watch接口监视Pod的变化情况,比如一个Pod被新建、删除或者更新。

3.1.3.ServiceRegistry

ServiceRegistry负责跟踪Kubernetes集群中运行的所有服务。根据提供的CloudProvider及MinionRegistry信息把ServiceRegistry封装成实现KubernetesAPIServer需要的RESTfulAPI接口REST。利用这些接口,我们可以对Service进行Create、Get、List、Update、Delete操作,以及监视Service变化情况的watch操作,并把Service信息存储到etcd。

3.1.4.ControllerRegistry

ControllerRegistry负责跟踪Kubernetes集群中所有的ReplicationController,ReplicationController维护着指定数量的pod副本(replicas)拷贝,如果其中的一个容器死掉,ReplicationController会自动启动一个新的容器,如果死掉的容器恢复,其会杀死多出的容器以保证指定的拷贝不变。通过封装ControllerRegistry为实现KubernetesAPIServer的RESTfulAPI接口REST,利用这些接口,我们可以对ReplicationController进行Create、Get、List、Update、Delete操作,以及监视ReplicationController变化情况的watch操作,并把ReplicationController信息存储到etcd。

3.1.5.EndpointsRegistry

EndpointsRegistry负责收集Service的endpoint,比如Name:"mysql",Endpoints:["10.10.1.1:1909","10.10.2.2:8834"],同PodRegistry,ControllerRegistry也实现了KubernetesAPIServer的RESTfulAPI接口,可以做Create、Get、List、Update、Delete以及watch操作。

3.1.6.BindingRegistry

Binding包括一个需要绑定Pod的ID和Pod被绑定的Host,Scheduler写BindingRegistry后,需绑定的Pod被绑定到一个host。BindingRegistry也实现了KubernetesAPIServer的RESTfulAPI接口,但BindingRegistry是一个write-only对象,所有只有Create操作可以使用,否则会引起错误。

3.1.7.Scheduler

Scheduler收集和分析当前Kubernetes集群中所有Minion节点的资源(内存、CPU)负载情况,然后依此分发新建的Pod到Kubernetes集群中可用的节点。由于一旦Minion节点的资源被分配给Pod,那这些资源就不能再分配给其他Pod,除非这些Pod被删除或者退出,因此,Kubernetes需要分析集群中所有Minion的资源使用情况,保证分发的工作负载不会超出当前该Minion节点的可用资源范围。具体来说,Scheduler做以下工作:

1)实时监测Kubernetes集群中未分发的Pod。

2)实时监测Kubernetes集群中所有运行的Pod,Scheduler需要根据这些Pod的资源状况安全地将未分发的Pod分发到指定的Minion节点上。

3)Scheduler也监测Minion节点信息,由于会频繁查找Minion节点,Scheduler会缓存一份最新的信息在本地。

4)最后,Scheduler在分发Pod到指定的Minion节点后,会把Pod相关的信息Binding写回APIServer。

4.2.Kubelet

图3-3Kubernetes详细构件

根据上图3-3可知Kubelet是Kubernetes集群中每个Minion和MasterAPIServer的连接点,Kubelet运行在每个Minion上,是MasterAPIServer和Minion之间的桥梁,接收MasterAPIServer分配给它的commands和work,与持久性键值存储etcd、file、server和http进行交互,读取配置信息。Kubelet的主要工作是管理Pod和容器的生命周期,其包括DockerClient、RootDirectory、PodWorkers、EtcdClient、CadvisorClient以及HealthChecker组件,具体工作如下:

1)通过Worker给Pod异步运行特定的Action。

2)设置容器的环境变量。

3)给容器绑定Volume。

4)给容器绑定Port。

5)根据指定的Pod运行一个单一容器。

6)杀死容器。

7)给指定的Pod创建network容器。

8)删除Pod的所有容器。

9)同步Pod的状态。

10)从Cadvisor获取containerinfo、podinfo、rootinfo、machineinfo。

11)检测Pod的容器健康状态信息。

12)在容器中运行命令。

4.3.Proxy

Proxy是为了解决外部网络能够访问跨机器集群中容器提供的应用服务而设计的,从上图3-3可知Proxy服务也运行在每个Minion上。Proxy提供TCP/UDPsockets的proxy,每创建一种Service,Proxy主要从etcd获取Services和Endpoints的配置信息,或者也可以从file获取,然后根据配置信息在Minion上启动一个Proxy的进程并监听相应的服务端口,当外部请求发生时,Proxy会根据LoadBalancer将请求分发到后端正确的容器处理。

5.下篇主题

下篇讲述在CentOS7上用Kubernetes来管理容器。

6.个人简介

杨章显,现就职于Cisco,主要从事WebExSaaS服务运维,系统性能分析等工作。特别关注云计算,自动化运维,部署等技术,尤其是Go、OpenvSwitch、Docker及其生态圈技术,如Kubernetes、Flocker等Docker相关开源项目。Email:[email protected]

7.参考资料

1.https://github.com/GoogleCloudPlatform/kubernetes/tree/master/docs

2.http://www.slideshare.net/rajdeep

3.http://www.docker.com

相关推荐