YouTube是如何在云中实现MySQL弹性部署的
一个新的网站可能会以指数级速度飞速发展。不久之后,你就要开始计划扩容来满足这种意想不到的需求。你当然可以通过不断地增加更多的前端服务器来解决问题,但最终,数据库会成为你的瓶颈,这会导致你:
添加多个副本获得更好的读取吞吐量和数据耐久性
- 引入分区来扩展你的写入吞吐量,并且让你的数据集增长超过单台机器
- 创建相互分离的副本池给批作业和备份来实现实时流量与副本的隔离
- 克隆整个部署到多个全世界范围内的数据中心中来满足灾难恢复和更低延迟的需求
在YouTube,我们完成了扩容MySQL的部署,它现在可以处理数以亿计的日常视频浏览量和每分钟300小时新视频的上传量。为了实现这些需求,我们开发了Vitess平台,它可以解决扩容挑战且隐藏相关来自于应用层复杂度。
Vitess是一个面向于缩放MySQL的存储平台。它优化了MySQL在专用的硬件上的运行效率,就像在云架构里一样。他结合了很多重要的MySQL里的特性和NoSQL数据库的扩展性。
Vitess是一个可用的开源项目,并且可以很好地运行在容器环境下。如果你使用Kubernetes和Google Container Engine作为你的的容器集群管理器,上手Vitess会变得非常简单。我们给Vitess创建了一个单点开发部署配置,使它可以运行在任何 Kubernetes支持的平台上。
另外,为了更容易的部署容器集群,Vitess还充分利用了由容器集群管理器所带来的好处,特别是:
- 水平扩展:通过运行更多的节点来增加能力而不是建一个巨大的节点
- 动态布置:让集群管理器调度Vitess容器到任何位置
- 声明规格:描述你想要的最终状态,然后让容器管理器去创建它
- 自愈组件:机器失败自动恢复
在这个环境下,Vitess提供了一个MySQL存储层,包括提升持久性,扩展性和易管理性。
我们也只是刚刚开始这样的集成,但你已经可以运行Vitess在你自己的Kubernetes上。对于更多的关于Vitess的问题,请查询我们的网站,在论坛里提出问题,或者到GitHub上加入讨论。特别注意看一看我们的综述,去理解相比于NoSQL的解决方案和像Google Cloud SQL一样全面管理MySQL的解决方案,我们在Vitess所做的权衡。