阿里云总裁王坚:“云计算就是云服务。”
昨天阿里巴巴宣布,截至2012年11月30日晚9点50分,阿里系旗下的淘宝和天猫总交易额本年度突破1万亿元。根据国家统计局数据,1万亿元零售额相当于2011年全国各省社会消费品零售总额的5.4%。这一数据仅次于广东、山东、江苏和浙江四省2011年的零售交易额。
对于这庞大的数字,实在让我觉得咂舌,然而最令我咂舌的并不是交易额!而是这交易额背后的数据传输与处理。几乎每分每秒都有上百张单提交,传统的服务器的运算能力根本不足以支撑,这里是不是需要用到云计算技术的支持?看了王坚博士的访谈,我终于明白云计算与大数据的关系,这真不是一般服务器可以解决的问题~以下就是我为大家节选的部分,希望同时大家都可以一起去了解阿里云计算的魅力之处。
图1:阿里巴巴CTO、阿里云总裁王坚博士
真正的云计算是以数据为中心的
InfoQ:阿里巴巴的技术比较开放,敢于让技术人员出去分享,作为阿里巴巴集团的CTO,您如何看待这样的事情?
王坚博士:首先阿里巴巴是一家服务公司,不是软件公司。虽然不同的部门对技术分享这个事情理解还不太一样,开放程度也不同,但是整体上,对技术分享我们是非常支持的。一方面,阿里巴巴的业务大多数是平台性质,拿出去讲也没有什么关系,即使现在我们将飞天的源代码给你,你也不一定能用,在这方面,我们还是很有信心的;另外,这和企业的传统文化也有很大的关系,阿里巴巴是一家好打抱不平的公司,愿意帮助弱小者成长,可以说我们是有分享的基因在里面的。
InfoQ:在09年的时候我就看过您关于大数据分析的一些分享,当时很多人还不是很理解,三年过后,这已经是任何一个大公司发展过程中绕不开的话题,您的这些前瞻性的观点从何而来?
王坚博士:我认为我还是蛮有运气的。2006年我在微软工作的时候,就成立了一个研究数据智能的小组,因为这个原因,当时看了很多和数据相关的东西,这些资料也帮助我去思考。我记得那时候微软的Office产品第一次有了收集用户反馈意见的功能,就是弹出一个框,询问你是否参与微软的用户体验改进计划。这也让我第一次认识到互联网对数据的影响,也明白了云计算的基本道理:云计算就是为数据处理而生的,而存放数据(Hosting)只是其中的一小部分。看一家公司的变化,只需要看Hosting在其业务中扮演的角色就知道了,我认为50%是一个临界点,而阿里巴巴目前已经远超过这个数值。
你可以理解,现在阿里云是一个数据处理公司,不是以计算为中心的,而是以数据为中心的,阿里云也有志成为一家真正的云计算公司。开始的时候很多同事不是很理解数据和处理之间的关系,经常被我搞疯掉,辛辛苦苦做的一个系统,可能很快就被否决掉,后来到了盘古这一层才算通了。所以说,云计算的真正意义还是在数据业务,数据沉淀在哪里就应该在哪里处理,而不是将数据和处理这两件事情分开。
云计算提供的应该是综合性服务
InfoQ:飞天项目的愿景也非常大,这个云计算的平台上包括云OS,包括内核,也包括存储服务。那么这个平台除了为阿里巴巴内部使用外,对外还提供什么服务?
王坚博士:飞天的架构还是非常大的,这在当时我们开始做飞天的时候,也引起了非常大的争议。很多人说我们做的东西太多了,太大了,不符合现实。这让我当时也非常纠结,但云计算就是一个综合服务,你让客户在这家公司买Hosting,在那家公司买CDN,然后再找一家公司做数据处理,他们肯定搞不定。中国网络电视台/央视网CNTV就是一个很好的例子,就是大多数情况下,你不能只提供一项服务,而是要帮助客户做完整的生意。其实不论是基础设施,还是平台,还是存储,都是天然整合在一起的,云计算的鼻祖亚马逊现在也是沿着这条路走的。
另外,阿里云飞天项目还有一点是需要说明的,就是不论是对外,还是对像天猫、支付宝这样的内部公司,阿里云所提供的基础服务都是一样的,我们并没有为天猫、支付宝单独定制什么功能,从版本升级,到系统兼容性,对内、对外都是一样的。在这次双十一购物狂欢节中,将有超过20%的订单是在我们的弹性计算上进行的,这可是每天1000万的PV量。换句话说,我们能够支撑双十一这样的业务,那么其他的互联网服务我们也是可以做的。
图2:阿里云飞天?云OS
InfoQ:目前有没有一些已经接到飞天平台上的案例,他们是如何使用的,或者说飞天是如何帮助他们的?
王坚博士:虽然我们的平台可以支持Hosting、CDN和数据处理,但是坦白来说,目前我们的客户主要用的还是Hosting的服务,稍大一点的客户会用到负载均衡,但像InfoQ这样的传媒行业,可能会用到CDN等,能使用到综合性服务的客户并不是很多,但这一定是一个趋势。这儿需要解释一下的是,在阿里云的产品里,并没有CDN这一项产品,但是我们是支持这个服务的。
另外,现在我们考虑的是如何让大数据也变成一个服务,这一点也是我们的客户,很多传统的客户教会我们的。基本上来看,Hosting是一头,数据处理是另外一头,现在Hosting占得比例比较大,但总有一天会是大数据。比如我们和CNTV的合作,从ODS(开放架构化数据服务)、RDS(关系型数据库服务)到CDN等能用的功能他们全用上了。
还有一个例子,我们有一个客户,做中间件的,开始的时候只是想把中间件从专有的存储设备迁移到我们的云计算平台上,最后发现不仅中间件,其实其工作平台也是可以用在云上的,员工甚至在家里就可以办公了,从而引起了其现有组织的变革,给公司的发展带来的新的机遇。这并不是说我们想做一个什么生态链,而是像福特生产线一样,很多结果都是自然而然到来的。就像电气化一样,电的出现改变了社会,但电网公司顺带也挣了点钱。阿里云也是一样,我们在改变整个生态,顺带也可能挣了点钱。
飞天开放平台不自己做应用
InfoQ:我看了飞天开放平台的一些介绍,也听一些朋友在谈,都认为这是阿里云的一个大动作,请帮助介绍一下飞天开放平台的起因、背景,以及能够解决的问题。
王坚博士:如果说阿里云的开放平台有什么不一样之处,那么这个开放平台的特点就是只关注云计算。整体来说,云计算是分两种的,一种寄生于业务,另外一种相对独立,和业务关系不大。阿里云属于后一种,不寄生于任何业务,也就是任何业务都可以在阿里云上进行。我们希望能够让小公司来做大公司的事情,比如Teamcola(一家提供工作日志存储的公司),让大公司也可以做小公司的事情,提高效率,比如中软国际等。
对于飞天开放平台,现在只是开始,希望能将能力开放给更多的开发者和公司。其实,在互联网时代,IT运维是如此地重要,像Teamcola这样的小公司,你很难想象如果不将数据放在云平台上,他们怎么成长?要知道现在单单是招聘运维人员就是很困难的,有时候业务的发展就是受自然法则的约束。另外就是很多公司,老的应用太多了,凭自己的技术能力,很难完成迁移,我们计划扶持一些公司来做类似的事情,帮助这些公司完成转变。
再者,飞天开放平台很坚持的一点就是,我们不自己做应用,而是鼓励其他人和公司来做,比如网盘,这样的应用对于一家云计算公司或者开放平台来说是很重要的,因为可以很容易地做出来并形成规模,但阿里云不做。我想这也是飞天开放平台和其他很多云平台不一样的地方吧。
图3:阿里云飞天开放平台
云计算在中国一定会起来的
InfoQ:对阿里云下一步有什么动作,您心中的规划或者期望是什么?对云计算在国内的发展,您认为下一阶段会有什么新的变化?
王坚博士:中国小而美的公司还是很多的,可能比美国还要多,我想如果将来有一半运行在阿里云上,就差不多了。目前阿里云的成本还是比较高,还不是很符合国内用户的使用习惯,但将来一定是可以降下去的。到那个时候,有更多的小公司起来,自然而然,创业的氛围、互联网的氛围也会越来越好。
从技术上来说,阿里云的系统已经做得很靠前了。我没有做过精确的统计,但是阿里云应该是世界上第二家有能力做多Master的公司,这个技术还是很有难度的。所以,近期不会对系统做大的调整,希望能够就系统的易用性、稳定性做些优化。
懂更深的角度来看,要做一个组件或者功能比较容易,难的是将整个系统立起来。这些都是技术问题,不是商业问题。比如让云计算的成本下降,很多人可能认为这是一个商业问题,其实不是,这是要从技术上解决的,如何让系统更省电,更节能等。
云计算在中国一定会起来的,以我们的经验来看,这是一件很难的事情,单是“提供云计算服务”这句话就有很多种定义,而且很多能够提供云计算能力的公司在技术上还有许多的缺陷,需要继续积累。但前景看好。
最后我想说的是,阿里云计算真心是碉堡了,诸如聚石塔的推出~更进一步促进云计算就是云服务的理念,要为企业提供全方位的服务并不是那么容易。所谓大者恒大,我信心阿里巴巴这样的大公司一定可以把云服务始终放在第一位!然后创新也是小企业的优势,更多小而美的公司起来的,那么我们的创业氛围、互联网氛围才会越来越好。