AWS公布一项全新机器学习服务,并面向开发者提供全球首款深度学习摄像机
AWS DeepLens
Amazon SageMaker与AWS DeepLens,让机器学习飞入“寻常开发者家”
就目前来看,机器学习的实现流程非常复杂,其中涉及大量试验与错误因素,且要求执行人员具备专项技能。开发人员与数据科学家必须首先对数据进行可视化、转换与预处理,从而将其转化为可由算法用于进行模型训练的正确格式。即使是最简单的模型也需要耗费大量计算资源与时间进行训练,而企业甚至可能需要雇用专门的团队来管理由大量GPU支持型服务器所建立的训练环境。另外,模型训练的整个过程充斥着大量人为介入与猜测性操作(从选择与优化算法,到调整将影响到模型准确性的数百万条参数)。在此之后,我们还需要利用不同的专业技能调整应用程序设计与分布式系统对接,从而将训练完成的模型引入实际应用程序。随着数据集与变量的增长,客户将不得不重复上述流程,因为模型已经过时、需要进行重复训练,否则将无法立足新的信息实现学习与发展。这一切都需要大量专业知识作为支撑,这必然要求投入大量的计算资源、存储容量以及时间。就目前来讲,机器学习对于大多数开发人员仍可谓遥不可及。
Amazon SageMaker是一项全托管机器学习服务,能够有效消除机器学习流程中各阶段所涉及的繁重转换与猜测工作。Amazon SageMaker提供预构建开发记事本、针对PB级数据集进行优化的多种流行机器学习算法,外加自动化模型调优机制,能够有效降低模型构建与训练的难度。Amazon SageMaker还能够显著简化并加速训练过程,自动完成基础设施的配置与管理工作,并借此训练模型以及运行推理进而完成预测。AWS DeepLens则从零开始设计,旨在帮助开发人员通过将该物理设备同广泛的教程、示例源代码以及原本熟知的AW服务进行匹配,最终获得构建、训练及部署模型的实践经验。
AWS公司机器学习副总裁Swami Sivasubramanian解释称,“我们最初设定的AWS发展愿景,是希望任何一位用户都能够像世界上规模最大的企业那样获得同样的技术、工具、规模与成本结构。我们希望所有开发人员都朐晚为广泛且成功地使用机器学习工具,而不必受限于其机器学习技术水平。Amazon SageMaker消除了机器学习流程当中的诸多难题与复杂性因素,使得开发人员能够轻松上手模型的构建、训练与部署工作。”
利用Amazon SageMaker,开发人员可以:
· 利用性能优化型算法轻松构建机器学习模型:Amazon SageMaker是一套全托管机器学习记事本环境,允许开发人员轻松对其存储在Amazon S3当中的数据进行探索与可视化处理,并利用各类流行库、框架及接口对数据进行转换。Amazon SageMaker中包含数十种最流行的深度学习算法(例如k平均值聚类、因式分解、线性回归与主成分分析),其中AWS优化后的运行速度比标准实现方案快十倍。开发人员只需要选择算法并指定其数据源,而后Amazon SageMaker将安装并配置底层驱动程序与框架。Amazon SageMaker还包含有原生TensorFlow与Apache MXNet集成,更多其它构架支持能力也将陆续引入。开人员亦可通过将框架及算法上传至Amazon EC2容器注册表中容器的方式指定希望使用的框架与算法。
· 快速、全托管训练:Amazon SageMaker使得训练更为简单。开发者只需要简单指定Amazon EC2实例的类型与数量,同时指定其数据位置即可。Amazon SageMaker将设置分布式计算集群、执行训练、将结果输出至Amazon S3,并在完成后关闭此集群。Amazon SageMaker能够自动利用超参数优化机制对模型进行调优,同时调数以千计的不同算法参数组合,从而实现更高的预测准确率。
· 一键式生产环境模型部署:Amazon SageMaker可承担起实例启动、模型部署以及安全HTTPS端点设置等任务,从而确保具体应用程序获得高数据吞吐量与低延迟预测,同时在多可用区(简称AZ)内实现各Amazon EC2实例的自动规模伸缩。其还提供A/B测试原生支持能力。在生产环境下,Amazon SageMaker能够消除机器学习基础设施管理层面的繁重任务、执行健康状态检查、应用安全补丁,并完成其它日常维护工作。
利用AWS DeepLens,开发人员能够:
· 获得机器学习实践经验:AWS DeepLens是业界首款具备深度学习功能且可实现完全编程的摄像机,旨在将深度学习能力交付至每一位开发人员手中。AWS DeepLens包含一台带有板载计算机的高清摄像机,其能够实时运行复杂的深度学习计算机视觉模型。其定制设计硬件每秒可运行超过1000亿次深度学习运算,同时附带示例项目、示例代码以及预训练模型——意味着毫无经验的开发人员也能够在十分钟之内轻松上手。开发人员可以对教程进行扩展,利用AWS Lambda函数创建自己的定制化深度学习项目。举例来说,用户可以对AWS DeepLens进行编程以识别牌照上的数字并触发家庭自动化系统开启车库门,或者利用其识别宠物狗爬上沙发的行为并及时向主人发送文本警告。
· 在云环境中训练模型,将成果部署在AWS DeepLens当中:AWS DeepLens可与Amazon SageMaker相结合,意味着开发人员能够在云端利用后者进行模型训练,而后仅通过AWS管理控制台中的数次点击将其部署在AWS DeepLens之上。该摄像机能够以实时方式立足自身设备完成模型运行。
NFL CIO兼高级副总裁Michelle McKenna-Doyle解释称,“我们深化了与AWS的合作关系,将其作为NFL的官方技术供应商,亦在积极利用Amazon SageMaker作为我们的下一代数据统计方案。通过将Amazon SageMaker引入我们的工具集,我们的开发人员不再需要为机器学习流程中的无意义的重复工作而担忧,转而真正构建粉丝们真正乐于接受的可视化、统计数据与体验。”
作为全球领先的高分辨率地球图像、数据与分析服务供应商,DigitalGlobe公司每天都需要与无数数据打交道。该公司Maxar技术首席技术官兼创始人Walter Scott博士指出,“DigitalGlobe公司致力于帮助人们更轻松地找到、访问并运行存储在AWS云中的100 PB图像库,从而利用深度学习分析卫星图像。我们计划使用Amazon SageMaker,利用托管的Jupyter笔记本工具借助PB级别的地球观测图像数据集进行模型训练。这意味着DigitalGlobe的地理空间大数据平台(简称GBDX)用户只需要按下一个按键,即可创建对应模型,并将其部署到一套可扩展的分布式规模环境当中。”
Hotels.com为全球领先的酒店品牌,以41种语言运营着90个本地化网站。Hotels.com与Expedia Affiliate Network公司副总裁兼首席数据科学官Matt Fryer指出,“在Hotels.com,我们一直高度关注如何提升行动速度,从而充分利用最新技术成果并保持创新优势。利用Amazon SageMaker,我们的团队得以利用分布式训练、优化算法与内置超参数功能立足规模最大的数据集快速构建精度更高的醋,从而缩短将模型投入实际生产所需要的时间周期。只需要一次API调用,Amazon SageMaker即可为我们显著降低机器学习的复杂性,使我们得以快速为客户创造更理想的使用体验。”
Intuit公司也意识到了机器学习的巨大价值与威力,且借此帮助客户做出更好的日常决策并精简工作流程。该公司首席数据官Ashok Srivastava解释称,“利用Amazon SageMaker,我们得以通过在该平台上构建并部署算法的方式加快自身人工智能项目的规模化进程。我们将创造新的大规模机器学习与人工智能算法,并将其部署在这一平台之上,最终解决我们客户所面对的各类复杂问题。”
路透社是全球领先的新闻与信息专业资源供应商。路透社人工智能与认知计算中心负责人Khalid Al-Kofahi指出,“过去25年以来,我们一直在开发先进的机器学习功能,旨在帮助我们的客户挖掘、连接、增强、组织并传递各类信息,确保他们能够成功简化工作流程并获取更多价值。利用Amazon SageMaker,我们得以在问答应用环境下设计出自然语言处理能力。我们的解决方案需要利用Amazon SageMaker的强大功能以多次进行深度学习配置。”
卡耐基梅隆大学计算机科学学院院长Andrew Moore指出,“深度学习是我们的学生们所发现的一大真正鼓舞人心的成果。其似乎每个星期都能够在机器人、语言以及生物学方面带来新的突破。而我之所以喜欢AWS DeepLens,也正是因为其似乎有可能令机器学习实验真正实现民主化。像我们这样的高校非常乐于将AWS DeepLens引入课堂与实验室,从而帮助加速学生们立足真实世界了解深度学习的流程。”
新的语音、语言与视觉服务亦允许应用开发者们更轻松地构建智能化应用程序。
对于那些不具备机器学习专业知识,但却有志于利用这些技术构建人工智能类新型应用程序的开发者,Amazon Transcribe、Amazon Translate、Amazon Comprehend以及 Amazon Rekognition Video能够提供高质量且高准确度的机器学习服务,同时保持可扩展性与成本效益。AWS机器学习副总裁Swami Sivasubramanian指出,“如今客户正越来越多地将Amazon S3作为一套可扩展、可靠且安全的数据湖,其中存储的数据量远超以往任何时候。这些客户希望能够将这些数据应用于企业与客户,因此他们需要易于使用的工具与技术以解锁数据中的情报。我们很高兴能够提供这四种新的机器学习应用服务,旨在帮助开发人员立即着手创建新一代智能应用程序,确保其有能力看到、听到、说出并与周边世界进行交互。”
· Amazon Transcribe (现处于预览阶段)能够将语音转换为文本,允许开发人员将存储在Amazon S3当中的音频文件转换为准确且完整的带标点文本。Amazon Transcribe已经进行训练,能够以高准确度处理低保真度音频——例如呼叫中心录音。Amazon Transcribe能够为各个单词生成一个时间戳,以便开发人员精确地将文本与源文件进行对齐。目前,Amazon Transcribe仅支持英语与西班牙语,未来还将有更多支持语种被加入进来。在接下来的几个月中,我们还将努力确保Amazon Transcribe得以同时识别音频文件中的多个发言人,并允许开发人员上传自定义词汇表,以便对包含这些词汇的音频进行更为准确的转录。
· Amazon Translate (现处于预览阶段)利用目前最先进的神经机器翻译技术,可提供将文本由一种语言转换为另一种语言的高准确度翻译能力。Amazon Translate可翻译不同长度的文本,并支持英语与其它六种语言(阿拉伯语、法语、德语、葡萄牙语、简体中文以及西班牙语)之间的翻译。更多翻译语种长城将于2018年推出。
· Amazon Comprehend (已正式推出)可立足文档、社交网络帖子、文章或AWS中存储的任何其它文本数据进行自然语言内容理解。Amazon Comprehend利用深度学习技术识别文本中的各实体(例如人物、地点、日期与组织)、文本所使用之语言、文本所表达的情感以及包含概念与形容词——例如美丽、温暖或阳光明媚等——的关键短语。Amazon Comprehend已经经历了广泛的数据集训练,包括来自Amazon.com的产品描述与客户评论,从而构建起能够从文本中提取重要结论的最佳语言模型。其还拥有主题建模功能,可帮助应用程序从文档集中提取常见主题。Amazon Comprehend与AWS Glue相集成,可对存储在Amazon S3、Amazon Redshift、Amazon RDS、Amazon DynamoDB或者其它流行Amazon 数据源中的文本数据进行端到端分析。
· Amazon Rekognition Video (现已推出)能够追踪大量存储于Amazon S3中的视频资料内的对象、面孔、名人与不当内容。其还提供实时流媒体视频,可对数百万人脸进行面部识别。Amazon Rekognition Video提供易于使用的API,且由计算机视觉模型进行驱动——这些模型经过训练,能够准确检测出数千个对象及其活动,并从存储在Amazon S3中的实况视频流及视频内容中提取基于情景信息的活动。Amazon Rekognition Video能够自动为视频的特定部分(例如海难、太阳、孩子)添加标签与位置、检测活动(例如跑步、跳跃与游泳),检测、识别并分析人脸,并追踪多个人物对象——即使其有可能被部分隐藏在画面当中。
Isentia公司CIO Andrea Walsh表示,“在Isentia,我们使用一种语言构建自己的媒体智能软件。为了扩大业务能力,满足客户多样化的语言需求,我们需要翻译支持以生成非英语媒体内容,同时提供有价值的见解。Amazon Translate服务给我们留下了深刻的印象,因为其能够被轻松整合至我们的管道当中,其强大的扩展能力确保我们能够处理任何数量的工作,且翻译结果更准确也更细致,足以满足客户提出的严格要求。”
RingDNA公司CEO兼创始人Howard Brown指出,“RingDNA是一套面向销售团队的端到端沟通平台。数百家企业利用RIngDNA大幅提升自身生产力,进行更为明智的销售对话,获取预测性销售洞察力,提高订单成功率并训练销售代表。RingDNA的Conversation AI中一大重要组成部分,在于能够以最佳方式实现每通电话的语音到文本内容转录。RingDNA对Amazon Transcribe的出现感到兴奋,因为其能够提供规模化高质量语音识别能力,帮助我们更好地完成每一项语音转录任务。”
《华盛顿邮报》数据科学主管Sam Han博士表示:“我们努力为近1亿读者提供最出色的体验,而内容的相关性是实现这一目标的关键性前提。在Amazon Comprehend的帮助下,我们得以利用持续训练的自然语言处理功能(例如关键词加主题API)提升内容的个性化程度、搜索引擎优化效果以及广告定位功能。”
Infor公司软件开发副总裁Manjunath Ganimasty指出,“构建智能应用程序以帮助客户促进业务发展是我们的核心目标所在。Amazon Comprehend允许我们在搜索、聊天与文档当中分析非结构化文本,从而理解其意图与情感。这样的能力使我们得以训练出自己的Coleman AI技能集,同时为客户提供真正具有针对性的定制化搜索体验。”
Elementum公司工程技术负责人Minh Chau指出,“自然语言处理非常困难。我们曾经对从闭源到开源的各类解决方案进行研究,希望利用其分析并理解我们的数据,但却一直没有找到任何一种能够使我们保持敏捷性、可扩展性以及成本效益的解决方案。Amazon Comprehend提供一种持续训练模式,使我们能够专注于自身业务,并在供应链管理(简称SCM)领域切实进行创新。”