案例解读|迁云的灵魂3问,降多少本,增多少效,真平滑否?
近年来,在线教育产业发展十分迅速,在线教育真正打破了时间和空间的限制,使得学员可以随时随地学习,预期2020年将有超过3000亿的市场规模。随着行业不断成熟,国家政策的规范发展使得在线教育的发展进入调整期,烧钱获客的模式不再持续,在兼顾业务发展的同时要注意成本控制。
那就需要注意两大问题。一是服务器资源作为IT基础设施支出的头部预算,如何合理利用服务器资源,按需扩容,节省人力维护成本是关键。第二点是由于教育行业的特殊性,满足国家政策对于互联网教育行业安全等级保护有要求,也是重中之重。围绕这两点,阿里云提供了全面的上云解决方案,帮助客户降本增效。
下面将以X教育客户为案例进行介绍。X教育客户为中小幼、考研留学及职场精英提供多元化的教育产品,包括课程直播、课程点播、互联网在线学习工具等,截止至2018年底已拥有用户接近2亿,是综合性互联网教育平台。
上云如何降本——减少运维消耗是关键
客户从最开始一台电脑提供服务,到现在已经拥有分布在多个机房的近千台服务器。随着业务的发展,问题也逐渐暴露,当前以自建IDC为主的模式下,资源利用率不高、部署冗余、运维和基础设备开发人力支出成本高,而且可预见的规模扩大,成本会大幅上升。
帮助客户上云后,优质的IDC和网络资源随时可用,物理环境零人力投入,相对成本线性,实际TCO更低。
图1 自建机房和阿里云TCO对比曲线
上云如何帮助客户增效
在线教育行业用户大部分都是闲时在线学习,晚上是业务高峰,其他时间资源利用率不高,另外X客户的运营推广活动会带来业务高峰考验基础设施支撑能力。在自建IDC的模式下是IT定义业务体量,运营团队与运维团队在推广活动前需规划业务流量,提前准备服务器来应对。
上云后,按需伸缩、即开即用的计算资源帮助X客户快速应对业务高峰带来的挑战,在数分钟内完成原本需数日甚至更长时间的服务配置和部署工作。阿里云利用特有的快速交付和弹性能力,让客户从全量为业务峰值准备计算力,过渡到贴合业务流量曲线准备计算力,从根本上提升资源利用率和部署效率。同时客户还可根据业务场景组合多种计费类型进一步降低成本(图2)。
图2 利用ECS的弹性计费模型进一步降低TCO
如何通过上云简单达到信息安全等级保护要求
随着面向未成年人的在线教育渗透率逐步上升,国家出台了多项针对在线教育行业的监管政策。教育部和公安部早在2015年就已经联合发布《关于全面推进教育行业信息安全等级保护工作的通知》,今年9月份教育部等八部门印发《关于引导规范教育移动互联网应用有序健康发展的意见》,其中第二章第四条明确要求教育APP提供者需要获得网络安全等级保护定级备案的证明、等级测评报告后进行备案登记。
政策的变化为X客户带来了新的挑战。为通过等保测评,客户在线下机房专门购置了安全硬件设备并投入人力做整改优化。而选择上云,阿里云提供了合规配套整改的安全方案,包括高防、WAF、众测、安骑士、态势感知等安全产品以及云上安全服务,助力客户低成本高效率完成等保备案工作。
上云千般好,如何平滑迁云是关键
不管从行业发展趋势还是客户业务发展的需求来看,上云会带来很大的价值,而上云对业务可能带来的影响是客户决策时顾虑最多的点。为保证H教育某互动教育平台的平滑上云,线上业务不受影响,我们先深入分析了客户云下架构,再根据业务需求设计云上架构以及可行的迁移的方案,逐步执行。
图3 云下架构示意图
云下架构中,业务应用服务分别部署在两个机房,由专线打通。自建MySQL采用同机房主备两台的方式做灾备,另外实时转码占用接近20%的总物理服务器资源,此外除了机房几百TB的NAS存储外,还有多达几PB的云存储文件。
图4 云上架构示意图
云上架构中,考虑到客户的Web应用服务已经实现了微服务化Kubernetes部署,云上对Web应用服务选择容器Kubernetes版无缝迁移,同时采用跨可用区的RDS MySQL高可用版本,相比同机房主备模式,提供更高的可用性。存储使用阿里云OSS,除了提供更高的可用性(不低于99.995%)和数据持久性(不低于99.9999999999%)之外,应用服务访问存储的时候可以走内部流量,节省带宽支出。
图5 迁移示意图
应用服务迁移过程中,使用阿里云SMC服务器迁移中心服务将在IDC部署的业务应用服务自动、快速、一站式迁移到云上ECS,同时提供工具支持将自建Kubernetes的应用迁移到云上。
数据库迁移上,使用数据传输服务DTS迁移数据,数据库无需停机且支持双向同步,上云切换过程支持数据库的回退方案。云原生数据库POLARDB提供传统数据库一键迁移上云的能力,客户无需修改底层代码就可完成数据库的上云。
存储服务迁移过程中,客户在上云前有海量的文件,而且大部份是小文件,选择使用阿里云提供的离线和在线的迁移工具来支持文件迁移到OSS,利用CDN的闲时流量迁移,基本没有产生额外的迁移带宽费用(CDN95计费)。对于主要是小文件的bucket,结合OSS的镜像回源功能,直接将数据源切换到阿里云OSS,无需等待迁移任务的数据同步完成。
从最后实施结果来看,客户的的整个迁移过程很迅速也很平滑,中间多次测试业务流量在云上云下来回切换对用户使用没有任何影响。
小结:上云的价值
1.成本显著优化
所有资源按需使用,上云后贴合业务流量曲线准备计算资源,成本大幅优化。客户后续还可结合RI实例券使用弹性伸缩产品进一步降低成本。
物理环境零人力投入,部署简化,效率提升,基础设施团队精简,人力投入到业务发展中。
2.更高的可用性和安全性
线下同机房部署主备数据库切换成云上跨可用区的RDS高可用版本,可用性更高。客户的云上跨可用区部署的高可用架构可根据需要随时升级为异地灾备部署,获得更高的可用性。
云上使用WAF,DDOS高防IP等专业安全产品,有专业安全团队更新维护,安全性更高。客户使用免费的防DDOS流量即可满足日常安全需要,在被攻击时,可迅速切换为高版本抵御超大流量的攻击行为,在成本和安全诉求之间找到平衡。
3.业务创新
上云后释放了操作系统,虚拟化,资源调度,网络研发等基础技术栈资源,聚焦到业务发展和业务创新。
云上站在达摩院肩上创新,适用于300+场景的阿里云AI产品家族云上即享.沪江教育研发团队结合教育行业场景使用语音识别,机器翻译等AI产品在做业务尝试和创新。
【附录】
1.本案例涉及到的产品
2.在线教育云上业务参考架构
本文作者:断木
本文为阿里云内容,未经允许不得转载。