芯片问题对云计算应用的影响低于事先预期
在多年来最大的一次计算漏洞事件被披露之后,事实证明我们的云计算使用情况完全不会受到太大的影响。
公共云计算可能是Spectre和Meltdown芯片漏洞事件中最危险的架构。但是,至少在打过最初的补丁之后,对这些平台的安全性和运行性能的影响似乎并没有如预测般的那么可怕。
许多行业观察家担心,这些芯片级漏洞可能会使多租户的公共云计算模式成为黑客访问同一共享主机上其他用户帐户数据的一个惹眼目标。但是主要云计算供应商们的及时响应——某些情况下是几个月的周期——已经极大地解决了这些问题。
客户们还必须更新这些位于云端的系统。但是通过使用这些底层的补丁程序,云计算环境已经很好地消除了用户们最初对于数据被窃的担忧。与拥有自有数据中心和需要对其硬件、微代码、管理程序以及可能的管理实例进行升级更新的企业用户相比,云计算用户所需做的工作要少得多。
“天毕竟没有塌,请放轻松,”Forrester 研究公司的分析师Gardner说。“它们可能是我们最近一段时间内看到的最重要的CPU缺陷问题,但是临时性解决方案可以有助于缓解这一问题带来的影响,而芯片制造商已经在致力于长期解决方案的开发。”
从某种程度上说,供应商们对于在Meltdown和Spectre漏洞上安装补丁的快速响应也说明了他们中心化与自动化所达到的高度。
“与硬件供应商和诸如Linux这样的开源项目不同,我们没有办法做到以与他们一样的速度来完成对项目进行打补丁,”总部位于波士顿的云计算托管服务供应商CloudHealth的创始人兼CTO Joe Kinsella说。“最终结果是证明了实际应对问题的中心化能力。”
安全专家表示,目前还没有发现任何已知的Meltdown和双向Spectre漏洞的破解方法。据安全专家称,通过这些漏洞(特别是Spectre)实施的黑客攻击已经超越了普通黑客的能力范围,他们更可能找到了一条阻力更小的攻击路径。
事实上,迄今为止Meltdown和Spectre漏洞的真正影响来自于打补丁过程本身。特别是微软公司在发布Meltdown和Spectre报告之后和解除封锁之前因对其Azure客户实施强制性的不定期重启而着实惹恼了他们。谷歌则表示,它可通过实施迁移所有客户来避免重启。
虽然亚马逊网络服务(AWS)、微软、谷歌以及其他云计算平台在解决这个问题上都不声不响地、不同程度地走在了前面,但一些小型云计算企业则被炒得沸沸扬扬。
AMD 和英特尔已经致力于固件升级以进一步缓解这个问题,但是这些早期版本的固件已经引起了他们自己的问题。据称更新补丁程序即将推出,但目前还不清楚是否需要又一轮云计算供应商的重启高峰。
Meltdown和Spectre的最初补丁是临时性措施——如果采用不依赖于预测执行的方法(这是一个基于这些漏洞根源的优化技术)重新设计芯片,那么就有可能需要花费数年时间。对这些芯片进行任何根本性的重新设计都有可能最终让云计算服务供应商受益良多,因为云计算供应商们可以比传统企业更频繁地更换硬件,从而更快地用上新的处理器。
这些漏洞可能会导致潜在用户降低他们的云计算使用率或者在从他们自己的数据中心转移出来之前执行额外的尽职调查。在金融行业以及其他受到高度监管的行业中,更是如此,这些行业目前只是刚刚开始接纳公共云计算的理念。
“如果你正在启动一个新项目,那么这就是一个现实的问题,”总部位于佛罗里达州奥兰多市的云计算托管供应商的CEO Marty Puranik说。“我无法想象一个首席风险官或首席安全官会说,这对于我们未来将要做的事情是无关紧要的。”
性能问题并不像初期预测的那么糟糕
Spectre和Meltdown 的另一个潜在影响是补丁程序将如何影响性能。最初的预测是最高达到三成的性能降低,受到影响的客户上网报告的问题将主要还是性能问题。但是,云计算供应商们已经推翻了这些预测,代表客户监管数千台服务器的多家托管服务供应商均表示绝大多数的工作负载并未受到影响。
虽然性能是否会随着时间推移而出现问题还有待进一步观察,但是IT专家们似乎也认同了供应商们的说法。超过十多个消息渠道(其中大部分人出于这个问题的敏感性和易变性方面的考虑而要求匿名)向SearchCloudComputing表示,他们几乎感受不到这些补丁程序带来性能方面的影响。
Kinsella表示,实际情况是受影响系统的数量是相当有限的,且其性能受影响的表现也是相当不稳定的。“如果补丁的影响有30%,那么我认为我们一定不会像现在这么处之泰然,因为这就好像逆向遵循摩尔定律回到了多年前,”他说。
总部设在旧金山的Zendesk公司技术运营副总裁Steve Loyd表示,随着2017年底AWS发出多次重启通知以来,其云计算平台运行表现有所变化。这些重启并不受到客户欢迎,但也确实优于替代方案,同时截至目前公司还没有在补丁测试过程中发现任何较大的影响,他说。
谷歌表示没有收到任何其云计算客户受到显著影响的报告,而微软与AWS最初曾表示他们预期会有少部分客户能够察觉出性能下降。目前还不清楚微软是如何为那些客户缓解这些问题所带来的负面影响,但是公司建议用户使用速度更快的网络服务。AWS在一份声明中表示,自从安装补丁程序以来,他们一直致力于帮助受影响用户进行工作负载优化,并且“有计划在任何情况下都能防止用户的云计算成本发生重大变化”。
除了这些对云计算使用的微不足道影响以外,最大的潜在影响是所有扩展使用操作系统内核的应用,例如分布式数据库或缓存系统等。当然,内部的同一类型工作负载也可能面临着相同的问题,但即便是一个小小的影响也会造成大大的后果。
“如果任何一个单一系统受到的影响不超过1%,那么其后果是可以忽略不计的,”总部位于波士顿的混合云计算管理供应商Trubonomic的首席宣导者Eric Wright说。“但是,如果一共有100多个系统,那么就必须在工作负载上增加一个新的虚拟系统。所以,无论进行怎样的分割,总是会有一些影响的。”
云计算服务供应商们也可能因为定价计划而受到客户的青睐。一个拥有自有数据中心的企业可能会采用增加一些使用不足的服务器来解决这个问题。但是,云计算供应商是根据CPU资源来收费的,运行速度较慢的工作负载可能会产生更为明显的影响,IDC分析师Pete Lindstrom说。
“这可能比较主观,但确实是安全专家工作的方式,”他说。“说真的,他们真正关心的问题是这个月的账单会是什么样的,以及是否真的会有影响?”
性能影响的最大受益者可能是抽象服务,例如无服务器或平台即服务产品。在这些应用场景中,所有的补丁都由供应商负责,分析人士认为,对于客户来说,这些服务将不会有所改变。