在Serverless Kubernetes集群中轻松运行Argo Workflow

导读

Argo是一个基于kubernetes实现的一个Workflow(工作流)开源工具,基于kubernetes的调度能力实现了工作流的控制和任务的运行。
目前阿里云容器服务ACK集群中已经支持工作流的部署和调度,这里我们介绍如果在ASK(Serverless Kubernetes)集群中使用Argo,无需预留节点资源池,即可灵活动态的运行工作流任务,并最大化节省用户的计算成本。

前置条件:

  • 创建ASK集群 https://cs.console.aliyun.com/#/k8s/cluster/create/serverless
    因为argo创建的pod往往需要大规格cpu和mem资源,因此建议创建多可用区ASK集群,当一个可用区库存不足时,后台会在其他可用区尝试创建pod,以缓解单可用区库存不足的情况。
  • 下载ags命令行,可参考https://help.aliyun.com/document_detail/121342.html

部署argo workflow controller

# ags install

# kubectl -n argo get pod
NAME READY STATUS RESTARTS AGE
argo-ui-5c5dbd7d75-hxqfd 1/1 Running 0 60s
workflow-controller-848cf55b64-6pzc9 1/1 Running 0 60s

# kubectl -n argo get configmap
NAME DATA AGE
workflow-controller-configmap 0 4m55s

argo默认使用docker executor api,在serverless集群中我们需要切换成k8sapi才能正常工作。

# kubectl -n argo edit configmap workflow-controller-configmap
apiVersion: v1
kind: ConfigMap
...
data:
 config: |
 containerRuntimeExecutor: k8sapi

运行Hello-World Workflow示例

下面我们运行Hello-World example:https://github.com/argoproj/argo/blob/master/examples/hello-world.yaml

# ags submit https://raw.githubusercontent.com/argoproj/argo/master/examples/hello-world.yaml
Name: hello-world-l26sx
Namespace: default
ServiceAccount: default
Status: Pending
Created: Fri Nov 15 14:45:15 +0800 (now)

# kubectl get pod
NAME READY STATUS RESTARTS AGE
hello-world-l26sx 0/2 Completed 0 88s

# ags list
NAME STATUS AGE DURATION PRIORITY
hello-world-l26sx Succeeded 1m 1m 0

当我们需要使用大规格资源来运行workflow时,可以在workflow中给pod指定anntation。

注意此情况不要在container中指定大规格requests/limits,因为argo生成的pod中包含多个container,给单个container指定大规格的requests/limits会导致eci无法给pod分配匹配的资源,进而导致创建失败。我们推荐给pod指定ecs规格或者cpu/mem保证pod正常运行,如下。

apiVersion: argoproj.io/v1alpha1
kind: Workflow
metadata:
 generateName: hello-world-
spec:
 entrypoint: whalesay
 templates:
 - name: whalesay
 metadata:
 annotations:
 k8s.aliyun.com/eci-instance-type : "ecs.ic5.3xlarge"
 container:
 image: docker/whalesay:latest
 command: [cowsay]
 args: ["hello world"]

结束

当运行结束后,可以清理workflow资源。

# ags delete hello-world-l26sx
Workflow 'hello-world-l26sx' deleted

# kubectl get pod
No resources found.

我们可以看到,因为ASK集群天然无需管理节点资源池,所有pod按需创建,很好的匹配了Argo工作流的任务形态,灵活动态的按需分配计算资源,更好的节省成本。

作者:贤维

本文为云栖社区原创内容,未经允许不得转载。