互联网就是一块“云”
如果把互联网和云计算结合在一起,就会拥有一台完整的机器,完成大脑的三项重要工作:信息存储、处理和交流
我不知道50年后互联网的发展情况。但是我确实清楚它未来10年至20年的发展,我确定它的发展将建立在脑科学的理论基础之上。这个行业的其他竞争者也预见了这一事实。
Google的拉里·佩奇和谢尔盖·布林在斯坦福大学学习人工智能,师从特里·威诺格拉德,他是这个领域杰出的权威,并且他们把所学付诸实践,成立并发 展了他们的公司,这绝非巧合。(实际上,Google的第18位员工就是一名脑外科医生,他后来成为Google的营运主管。)
事实上,最成功的互联网公司都直接或间接地以一个信念为前提,即互联网将会发展得越来越像人脑。
计算机的下一轮变革开始了,这是一个“云计算”取代独立的计算机的阶段。数以百万计的公司开始选择使用具有再生能力的“云”资源,“云”中老去的部件很快会被更新更快的部件取代,“云”就像具有生命力的生物。
谷歌的秘密建筑群
一座名叫达拉斯的城市,在这里,人们发现了一座神秘的建筑矗立在这片荒芜的景观中。这座建筑有两个橄榄球场那么长,上方耸立着4个冷却塔,周围是高高的带刺铁丝网围栏。
当这项建筑工程开工的时候,达拉斯的居民只是知道这个建筑群是由互联网搜索巨人Google建造的,其余的情况就不得而知了。在得知附近OVF公司 (Orchard View Farms)的IT经理和其他几个当地人加盟其中之后, 各种猜测声迭起。当签署了保密协议的Google新员工不愿意描述他们在里面所看到的和他们所从事的工作时,猜测声更加强烈。
Google最后决定邀请《达拉斯纪事报》(The Dalles Chronicle)的记者和编辑来采访。如果这些记者真正深入这幢建筑物的核心区域,他们可能会看到:数以千计的计算机,连接在金属箱里,有40台或 50台中央处理器的热气大量地飘浮在上空,升腾到4个冷却塔。他们还可能会看到灰色的电缆和蓝色、橙色的以太网电缆蜿蜒遍布整幢建筑物,连接着个人计算 机,大约100位IT员工为这些个人计算机的需求提供服务,为了保护耳朵不受风扇发出的嘈杂声所影响,他们都戴上了隔音耳套。
如果你想象一下电影《黑客帝国》中的场景,许多人被聚集在一起,用来收集电能,那么你的想象是正确的,只不过那些人被替换成了计算机。
互联网将越变越大
为什么会如此神秘呢?部分原因是出于竞争优势的考虑。将数以千计的普通计算机相连,Google构建了一个超级计算机。
达拉斯服务器集群(也称为多处理器群)是Google——也可能是世界上——在进行并行计算方面最先进的成就:使用许多计算机同时完成多重任务。达拉斯 服务器集群似乎是Google最先进的成就, 但它不是唯一的:Google有24个大型服务器集群遍布整个美国。即使细节信息不为人知,服务器的总数也很可能超过50万个,它们具有200PB(千万 亿字节)硬盘存储容量和4PB随机存储容量。这样想一下,1PB相当于10000004个字节,你的iPod就能容纳100多万首歌。
通过由多部服务器集群所组成的庞大系统进行一项工程浩大的计算工作,Google创造了“云计算”,即数千台价格低廉的计算机通过大规模并行处理来获得巨 大的计算能力。问题的关键在于,这样做不仅便宜,而且,从普通计算机的随机存储器获取信息,要比从一个超级计算机密集的磁盘驱动器获取信息的速度更快。
Google的“云计算”开始于克里斯托夫·比希利亚,他是一位27岁的计算机工程师。Google已经发明了分布式计算系统(云计算的核心技术),这 是一个专利软件,它可以将一项任务分拆成无数项子任务,由大量的计算机来执行,然后在十亿分之一秒内完成处理结果。现在比希利亚又向Google的总裁埃 里克·施密特提出了新的想法:利用分布式计算系统的基本功能,由小型个人计算机构建一台大型计算机。他的想法得到了施密特的鼓励。
接 着,IBM的总裁萨姆·帕米萨诺也给予了支持——40台计算机连接在一起——这项试验开始了。这一年是2006年。现在Google有50万台计算机在并 行工作。实际上,正在独立建立云计算服务器集群的公司(包括Google、IBM、微软、雅虎和亚马逊)现在有超过200万台计算机在同时工作。
这些机器消耗的电力和拉斯韦加斯市在炎热的夏日里消耗的一样多,所以这些公司面临的艰巨任务就是要找到更多(廉价)的电力资源。无巧不成书,中国正在考虑建立一系列核电站,这些提供云计算的公司已经迫不及待了——尽管他们不愿这样说。
它的未来在哪里?IBM的科研主管马克·迪恩曾经说过,随着云计算能力的发展,互联网也将越变越大。“互联网太小了,”他说,“有一天我们会嘲笑它的渺小。”
互联网的智能发展方向
Google和其他云计算服务提供商希望他们的云计算能够具有一些类似人类的智慧。也就是说,他们寻求更好的分布式计算,这个目标与脑科学家吉姆·安德森和他的人造大脑团队的追求目标是一致的。这个目标就是:创造人类大脑中的迂回渐进、反复的思维模式。
Google的工作开始于分布式计算系统,一个简单的、功能强大的软件程序,能够进行自动的并行处理和大规模计算工作的分布。也就是说,它能够让 Google使用“云”资源和互联网来并行思考。分布式计算系统和我们大脑的工作方式一样:对重要的信息进行分类,然后把它们分布到个人计算机组成的服务 群里,删除不相关的信息;而计算机——与分布式计算系统和大脑不同——接收所有的信息。
分布式计算系统摒弃了传统计算机的机械性(正如 Google一位资深的副总裁最近吹嘘的,“我们建立的服务器集群比其他公司的都灵活”)。Google现在把分布式计算系统应用于数万个程序中,从卫星 图像的处理、大规模机器学习问题,到语言处理和常见问题的回答。它每天要处理大约10万种不同功能的应用程序,分析20PB字节的数据。
分布式计算系统的发明者在最新的文章中指出:“它已经被广泛应用于Google内部的各个领域,这包括:大规模的机器学习问题、聚类问题;提取数据进行 常见问题的报告;提取网页的特点用于新的实验和产品;卫星图像数据的处理;语言模式处理用于数据机器的翻译;大规模图表计算。”也就是说,Google完 成的任务和大脑发挥的功能很相似:学习、分类、视界和语言。
这一系列任务提供了大量信息数据的分析——从美国人投票习惯、飞机票价的波动,到大量的健康数据。“千万亿字节时代的最大挑战不是存储所有的数据,”《连线》杂志最新评论道,“而是如何理解这些数据。”理解数据,这正是互联网智能目前的发展方向。
互联网——一种“云”资源
互联网和云计算有什么关联呢?互联网就是一块“云”——大量的计算机连接在一起进行交流。互联网主要不是进行计算的,但是,没有什么能够阻挡我们将整个 互联网作为一个拥有巨大计算能力的资源库。如果你把互联网和云计算结合在一起,你就会拥有一台完整的机器,完成大脑的三项重要工作:信息存储、处理和交 流。
当信息处理云模式和信息交流云模式结合在一起,以类似于人脑的迂回渐进的思维方式并行运行时,人一样的智慧就可能在互联网上出现。 2003年,在还没有加盟Google的前几年,Google的总裁埃里克·施密特曾说过:“当网络变得和处理器一样快时,计算机中的信息就会释放出来, 遍布整个网络。”在这个阶段,互联网上所有的信息必须压缩,就像我们的纸质大脑模型一样;在这个阶段,必须建立模式;在这个阶段,大量的构想转瞬即逝,这 时候就产生了智能。
在最新一期的《纽约时报》上,比尔·盖茨认为科技的发展——向智能发展——和大马哈鱼奋力逆流而上一样势不可挡。“它们(Google)做到了分布式计算系统。”他说,“但是我们的Dryad会做得更好。”他停顿了一下,然后不得不承认还会有更强大、更适合的系统出现,“而它们还会做得更好。”
比尔·盖茨说得没错,发展势不可挡。
(摘自《我们改变了互联网,还是互联网改变了我们?》第一篇,作者:[美]杰弗里·斯蒂伯,文章标题及文中小标题为编者加,艾经纬 整理)
转载于:开源中国社区(oschina.net),http://www.oschina.net/news/18151/internet-is-cloud