首家上榜中国公司,阿里云图像识别比亚马逊快 2.36 倍!
近日,斯坦福大学公布最新 DAWNBench 深度学习推理榜单,该榜单是人工智能领域最权威的竞赛之一,亚马逊 AWS 及谷歌均榜上有名,它要求参赛机构的计算平台对 5 万张图片进行精准识别并分类。在最近的一次测试结果中,阿里云的识别速度打破了亚马逊保持八个月的记录,成为首次出现在该榜单的中国科技公司。
根据结果显示,阿里云识别图片的速度比亚马逊快 2.36 倍,比谷歌快 5.28 倍。阿里云可以获胜的关键是强大的计算能力,其突破点在于针对图像识别任务研发了加速框架,可以自动将深度学习推理模型从 32 比特压缩到 8 比特,占用的计算资源将减少 4 倍,速度也由此提升了 4 倍。
阿里云参与了 DAWNbench 竞赛中的两个项目:一是针对 ImageNet 验证集中 50000 张图片的分类任务,要求分类模型的 Top-5 精度不低于 93%,统计分类每一张图片的平均延迟,延迟越低,性能越高,排名越高;二是在每次一张的情况下,完成 50000 张图片推理的平均成本。比赛中,阿里云技术团队使用 ecs.gn5i-c8g1.2xlarge 实例,以每张图片 4.218ms 的性能,0.00000154 美金的推理成本分别登顶推理性能和成本榜单,不仅性能是第二名基于 Amazon EC2 [c5.18xlarge] 实例的 2.36 倍,而且平均每张图片的推理成本也比第二名低 6.1%。
在人工智能技术领域的研究中,尽管研究人员对系统、算法和硬件进行了大量的研究,以加速深度学习的工作负载,但是却没有标准的方法以评估端到端深度学习(end-to-end deep learning)性能。斯坦福大学提出的 Dawnbench 就是一种用于端到端深度学习训练和推理的基准套件,它提供了一组常见的深度学习工作负载,用于在不同的优化策略、模型架构、软件框架、云和硬件上量化训练时间、训练成本、推理延迟和推理成本。
此前,Intel 的 ResNet 模型 (Caffe 框架),即完全由 Xeon 处理器构建的亚马逊 EC2 平台,在推理延迟和推理成本上都拿下第一。具体来说,Intel 平台处理 10000 张图片的延迟是 9.96ms,成本 0.02 美元。阿里云本次获得了图像识别性能及成本双料冠军,其中一项的成本同样为 0.02 美元。
早在今年 5 月份,阿里巴巴集团 CEO 张勇就在发言中表示:AI(人工智能)对于很多人来说可能是新事物,但阿里巴巴早已大规模应用。当大家第一次听到 AI 时,我们还以为说的是 Alibaba Intellegence(阿里智能)。阿里云弹性计算负责人余锋表示,随着人工智能等计算场景的普及,计算芯片将术业有专攻,算力的大幅提升将成为业务创新的基石。