CNCF案例研究:蚂蚁金服
蚂蚁金服利用Kubernetes的高速增长策略
公司:蚂蚁金服
地点:中国杭州
行业:金融服务
挑战
蚂蚁金服于2014年10月正式成立,源自2004年推出的全球最大的在线支付平台支付宝。该公司还利用技术创新提供众多其他服务。随着支付宝处理其全球9亿多用户(通过其本地和全球合作伙伴)的交易量 - 在2017年双十一的高峰期每秒256,000笔交易,以及2018年双十一的总商品价值310亿美元 - 更不用说其他服务,蚂蚁金服面临着“全新的数据处理挑战”,负责存储和计算产品管理的Haojie Hang说。“我们看到了在这种规模下运营的三个主要问题:如何提供实时计算、存储和处理能力,例如为欺诈检测提供实时建议;如何在这些数据之上提供智能,因为数据太多,我们没有获得足够的洞察力;以及如何在应用程序级别,中间件级别,系统级别甚至芯片级别提供安全性。”为了向其客户提供可靠和一致的服务,蚂蚁金服在2014年初拥抱了容器,很快就需要为数据中心的数万个节点集群提供一个编排解决方案。
解决方法
在调查了几项技术后,该团队选择了Kubernetes作容器编排,以及其他一些CNCF项目,包括Prometheus、OpenTracing、etcd和CoreDNS。“2016年底,我们认为Kubernetes将成为事实上的标准,”Haojie说。“回顾过去,我们在合适的技术上做出了正确的选择。但是,我们需要将生产工作量从遗留基础设施转移到最新的Kubernetes平台,这需要一些时间,因为我们在可靠性和一致性方面非常谨慎。”所有核心财务系统都在2017年11月容器化,正在迁移到Kubernetes。
影响
“我们已经看到使用云原生技术在运营方面至少提高了十倍,这意味着你的产出可以增加十倍,”Haojie说。蚂蚁也为全球的业务合作伙伴提供完全集成的金融云平台,希望通过在服务创新和技术专业知识方面的丰富经验为下一代数字银行提供支持。Haojie表示,该团队还没有开始关注优化Kubernetes平台:“因为我们还处于超高速增长阶段,我们还没有采用节约成本的模式。”
“2016年底,我们认为Kubernetes将成为事实上的标准。回顾过去,我们在合适的技术上做出了正确的选择。” - Haojie Hang,产品管理,蚂蚁金服
作为跨国集团阿里巴巴的分拆公司,蚂蚁金服拥有1500亿美元的估值以及相匹配的规模。该金融科技创业公司于2014年成立,由全球最大的在线支付平台支付宝以及利用技术创新的众多其他服务组成。
支付宝为全球超过9亿用户(通过其本地和全球合作伙伴)处理的交易量惊人:2017年双11高峰期每秒256,000次,2018年双11总商品价值310亿美元。蚂蚁金服以“为世界带来更多平等的机会”为使命,致力于通过技术创新创建开放、共享的信用体系和金融服务平台。
再加上其他业务的运营 - 如花呗在线信贷系统、借呗贷款服务以及3.5亿用户的蚂蚁森林绿色能源移动应用程序 - 蚂蚁金服面临着“全新的数据处理挑战”,负责存储和计算产品管理的Haojie Hang说。“我们看到了在这种规模下运营的三个主要问题:如何提供实时计算、存储和处理能力,例如为欺诈检测提供实时建议;如何在这些数据之上提供智能,因为数据太多,我们没有获得足够的洞察力;以及如何在应用程序级别,中间件级别,系统级别甚至芯片级别提供安全性。”
为了应对这些挑战,为其客户提供可靠和一致的服务,蚂蚁金服在2014年采用了Docker容器化。但他们很快意识到需要为公司数据中心的数万个节点集群提供编排解决方案。
“在今年的双11上,我们有很多节点运行Kubernetes,但与基础设施的整体规模相比,这仍然在进行中。” - Ranger Yu,全球技术合作伙伴关系与发展,蚂蚁金服
该团队研究了几种技术,包括Docker Swarm和Mesos。“我们做了很多POC,但我们在生产系统方面非常谨慎,因为我们希望确保不会丢失任何数据。”Haojie说。“你不能让服务停工一分钟,甚至一秒钟也会产生非常非常大的影响。我们每天都在为中国和全球的消费者和企业提供可靠、一致的服务的前提下运营。”
最终,Haojie说蚂蚁选择了Kubernetes,因为它满足了所有需求方框:一个强大的社区、“将在未来三到五年内是相关的技术”,以及与公司工程人才的良好匹配。“2016年底,我们认为Kubernetes将成为事实上的标准。”Haojie说。“回顾过去,我们在合适的技术上做出了正确的选择。但是,我们需要将生产工作量从遗留基础设施转移到最新的Kubernetes平台。我们花了很多时间学习,然后培训我们的员工在Kubernetes上很好地构建应用程序。”
所有核心财务系统都在2017年11月进行了容器化,正在迁移到Kubernetes。蚂蚁的平台还利用了许多其他CNCF项目,包括Prometheus、OpenTracing、etcd和CoreDNS。“在今年的双11,我们有很多节点运行Kubernetes,但与基础设施的整体规模相比,这仍然在进行中。”全球技术合作伙伴关系与发展的Ranger Yu说。
“我们非常感谢CNCF和这项令人惊叹的技术,这是我们在全球不断扩展所需要的。我们肯定会在未来更拥抱社区和开源。” - Haojie Hang,产品管理,蚂蚁金服
这已经产生了影响。“云原生技术使我们在效率方面受益匪浅。”Haojie说。“总的来说,我们希望确保我们的基础设施敏捷和灵活,足以应对明天可能发生的工作。这就是目标。借助云原生技术,我们已经看到运营改进至少十倍,这意味着您可以将产出提高十倍。假设您正在一个人操作10个节点。使用云原生,明天你可以有100个节点。”
蚂蚁也为世界各地的合作伙伴提供其金融云平台,希望通过在服务创新和技术专业知识方面的丰富经验为下一代数字银行提供支持。Haojie说团队还没有开始专注于优化Kubernetes平台,“因为我们还处于超高速增长阶段,我们还没有采用节约成本的模式。”
在蚂蚁金服迁移到云原生期间,CNCF社区也是一项宝贵的资产。“如果你正在应用一项新技术,那么有一个社区与其他用户讨论技术问题是非常好的。”Haojie说。“我们非常感谢CNCF和这项令人惊叹的技术,这是我们在全球不断扩展所需要的。我们肯定会在未来更拥抱社区和开源。”
“在中国,我们是金融和其他相关服务创新方面的北极星。我们肯定希望通过我们对技术的投资,确保在未来5到10年内保持领先地位。” - Haojie Hang,产品管理,蚂蚁金服
事实上,该公司已经开始开源一些云原生中间件。“我们将非常积极主动,”Ranger说。“CNCF提供了一个平台,让每个人都可以加入或贡献组件。这是非常好的开源治理。”
展望未来,蚂蚁团队将继续评估许多其他CNCF项目。该团队在中国建立了服务网络社区,汇集了许多中国公司和开发者,共同探讨该技术的潜力。“对于中国开发者和最终用户来说,服务网络非常吸引,因为我们现在有很多遗留系统在运行,它是一个理想的中间层,可以将所有内容粘合在一起,包括新旧系统。”Haojie说。“对于新技术,我们会密切关注它们是否会持久。”
在蚂蚁,Kubernetes以优异的成绩通过了测试,团队希望其他公司也会效仿。“在中国,我们是金融和其他相关服务创新方面的北极星。”Haojie说。“我们肯定希望通过我们对技术的投资,确保在未来5到10年内保持领先地位。”
KubeCon + CloudNativeCon中国论坛提案征集(CFP)2月22日截止
KubeCon + CloudNativeCon 论坛让用户、开发人员、从业人员汇聚一堂,面对面进行交流合作。与会人员有 Kubernetes、Prometheus 及其他云原生计算基金会 (CNCF) 主办项目的领导,和我们一同探讨云原生生态系统发展方向。
Open Source Summit中国提案征集(CFP)2月22日截止
在Open Source Summit中国,与会者将共同合作及共享信息,了解最新和最有趣的开源技术,包括Linux、IoT、区块链、AI、网络等;并获得如何在开源社区中导向和引领的信息。
大会日期:
- 提案征集截止日期:太平洋标准时间 2 月 22 日,星期五,晚上 11:59
- 提案征集通知日期:2019 年 4 月 8 日
- 会议日程通告日期:2019 年 4 月 10 日
- 会议活动举办日期:2019 年 6 月 24 至 26 日
提醒:这是一场社区会议。因此,让我们尽量避开公然推销产品和/或供应商销售宣传。
KubeCon + CloudNativeCon和Open Source Summit赞助方案出炉