AWS狂秀人工智能“肌肉”,网友评价机智“还能国内发布吗”?
亚马逊AWS Re:Invent大会召开, 狂秀人工智能“肌肉”。在现场宣布推出 5 项机器学习新服务,以及一款面向开发者的深度学习型无线摄像机。Amazon SageMaker 是为开发人员和数据科学家提供的全托管式服务,可以快速构建、培训、部署和管理自己的机器学习模型。AWS DeepLens 是一款深度学习型无线摄像机,可以运行实时计算机视觉模型,为开发者提供机器学习的实践经验。而且,AWS 还宣布了 4 项新的应用服务,允许开发人员构建仿效人类认知的应用程序:Amazon Transcribe 将语音转换为文本;Amazon Translate 可以翻译不同语言之间的文本;Amazon Comprehend 能够理解自然语言;Amazon Rekognition Video 是一种新的计算机视觉服务,可以批量实时分析视频。
在《亚马逊推出价值250美元的AI相机和机器学习工具》这篇文章中我们已经为大家介绍了AWS DeepLens、SageMaker,以下是其他的应用服务介绍。
实时语言翻译(可预览版)
随着互联网的出现,世界变得更小了。信息可以在一眨眼之间在不同文化和国家之间进行储存和传播,为了使我们能够利用所有这些强大的知识和数据传输工具,首先必须突破一些可能阻碍信息共享和沟通的语言障碍。
方式之一就利用机器翻译和相关技术在各种语言之间进行翻译。机器翻译技术源于计算语言学研究领域,其重点在于使用软件将文本或语言从一种语言翻译成另一种语言。现在我们用神经网络来提高翻译方法的效率和质量。
今天首先介绍亚马逊的一种翻译,它是一种高质量的神经机器翻译服务,使用先进的机器学习技术,提供基于文本的内容的快速语言翻译,并支持开发提供多语言用户体验的应用程序。该服务目前处于预览状态,可用于翻译英文和支持的语言。
其中,有一项借助翻译服务。企业和企业间现在可以通过自动化语言翻译功能,让消费者以自己喜欢的语言访问网站、信息和资源,从而更容易地在其他地区扩展产品和服务。此外,客户还可以参与多人聊天。
Amazon Translate可与其他AWS服务一起使用,以建立强大的多语言体验或启用与语言无关的处理。例如,翻译服务可以与以下某些服务一起使用:
·Amazon S3:提供创建翻译文档存储库的功能
·AWS Elasticsearch:使用托管的Elasticsearch引擎创建多语言搜索
·Amazon Lex:使用文本和语音构建翻译聊天机器人
·AWS Lambda:启用动态网站内容的本地化
通过该服务,你可以实时在支持的语言范围内翻译文本。
自动语音识别(可预览版)
Amazon Transcribe是一种自动语音识别(ASR)服务,它使开发人员可以轻松地将语音添加到文本功能中。使用Amazon Transcribe API,你可以分析存储在Amazon S3中的音频文件,并使服务返回转录语音的文本文件。
Amazon Transcribe可用于许多常见的应用程序,包括转录客户服务电话以及在音频和视频内容上生成字幕。该服务可以将通用格式(如WAV和MP3)中存储的音频文件转录为单词,因此你可以通过搜索文本轻松找到原始来源中的音频。 Amazon Transcribe正在不断学习和改进,以跟上语言的发展。
大多数语音识别系统是输出一串没有标点符号的文本。 Amazon Transcribe则使用深度学习自动添加标点符号和格式,以便于阅读,并且无需进一步编辑即可使用。除此之外,它还支持电话音频,同时,也能够自动转录美国英语和西班牙语的演讲。
Amazon Transcribe API可以轻松将语音转换为文本。不需要复杂的编程,只需用几行代码调用API、Transcribe就会从存储在Amazon S3中的音频文件中返回文本。扩展和自定义你的语音识别词汇对于它来说也不是难事。你可以将新单词(连同其发音)添加到基本词汇表中。此功能可以帮助节省时间和额外的编辑功能。
在用例方面,Amazon Transcribe还可以为广泛的用例提供转录,包括客户服务、字幕、搜索和合规等方式来改善客户服务。
通过将音频输入转换为文本,Amazon Transcribe可让你构建可搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用Amazon Transcribe转录基于语音的交互,并使用Amazon Comprehend等其他AWS服务挖掘数据以获取洞察信息,从对话中提取意义和意图。
而且,它也可以帮助内容生成和媒体分发者自动生成可以随视频内容一起显示的带时间戳的字幕,从而提高访问量。
Amazon Conprehend(可用)
可以理解自然语言文本,包括文档、社交网络博客、文章或任何其它保存在 AWS 的文本数据。Amazon Conprehend 使用深度学习技术识别文本实体(例如,人物、地点、日期、组织)、文本使用的语言、文本表达的情绪,以及概念、形容词的关键词语(例如,漂亮的、温暖的或晴朗的)。Amazon Comprehend 已经经过了广泛的数据集的训练(其中包括 Amazon.com 上的产品描述和用户评价),以建立从文本中提取关键特征的最佳语言模型。它还拥有对标题进行建模的能力,可以帮助应用从文本的主体中提取常用的标题。Amazon Comprehend 还整合了 AWS Glue 以允许对保存在 Amazon S3、Amazon Redshift、Amazon Relational Database Service(Amazon RDS)、Amazon DynamoDB 或其它常用的 Amazon 数据源上的文本数据进行端到端的分析。
Amazon Rekognition Video(可用)
可以在保存在 Amazon S3 的几百万部视频中追踪人、检测活动,以及识别目标、面部、名人和不宜内容。它还可以对直播视频实时识别数百万张人脸。Amazon Rekognition Video 的易用 API 由计算机视觉模型驱动,这些模型被训练用于准确检测数千个目标和活动,并可以从直播视频流和保存在 Amazon S3 上的视频内容中提取基于运动的语境。Amazon Rekognition Video 可以自动地为视频的特定部分加上标签以及标记位置(例如,海滩、太阳、儿童),检测活动(例如跑步、跳跃、游泳),检测、识别和分析人脸,追踪多个人(即使他们在视频中被部分隐藏)。