10大人工智能领域引领媒体行业的自动化
在这个数据爆炸的时代,收集数据本身是不够的。它需要被加工,切片和切割,以获得经营和发展业务的洞察力。不幸的是,当今世界上大多数可用的数据是非结构化的和隐藏的,使得在没有显著的人类参与的情况下难以处理。媒体行业的大部分数据都属于这一类,但已经开始改变。
任何视频文件,并将大量的非结构化数据交织在其结构中这需要密切的人类参与才能理解和解码。它需要人力来完成内容管理,处理,解释,质量检查等最基本的工作,然后才能标记为可供分发。有趣的是,人工智能和ML算法,特别是深度学习,现在达到了与人类精确度相当的水平,以大规模地执行大部分这些任务。人工智能处于有利位置,既可以自动执行工作流程活动,也可以从隐藏资产“数据”中获得巨大的洞察力。因此,媒体行业目睹了自然语言处理(NLP),面部识别,异常检测等领域的几位获奖者,其中人工智能以其无与伦比的效率实现大规模自动化。2107标志着人工智能在广播中开始收获丰厚红利的重要一年,内容管理,后期制作,广告和更多垂直行业。他们说,这只是AI之旅的开始!
预测分析和深度学习
预测分析使用了一个重要的假设,即未来的行为可能受过去趋势的影响,并且在大多数情况下,它在一段时间内保持良好。在这些预测模型的基础上,一组假设将多个独立变量结合在一起(例如,对于内容个性化的变量——如年龄、性别、财务状况、教育、内容兴趣),以建立统计相关性。正是这些相关性的集体强度和程度,可以预测未来的行为。在这里阅读更多关于预测分析的知识。最近,利用神经网络来产生人类大脑般的分析能力的深度学习正在使机器学习到更高的认知水平。通过模拟人脑对情境的反应,深度学习带来了从旧学校暴力决策树到更真实的事物的显著转变。
媒体和娱乐行业的机器学习重点领域
过去几十年来,AI和ML一直在学术和研发领域,直到最近几年,真正的产业整合才开始取而代之。人工智能带来的技术可以自动执行大部分人力密集的任务,并且具有可扩展性,计算速度和可重复性等优点。通过自动化内容管理,媒体操作中的现有任务以及改善客户参与度和体验,它有很大的潜力来实现严重的成本节约。例如,AI可以自动执行复杂的音频/视频同步工作,从而节省大量的人工人力,并减少人为错误。以下是媒体和娱乐行业进入前十大AI转型领域。
1、深入的视频分析,翻译,转录和标记 - AI花了几年的时间来完善手写识别并迅速转向自然语言理解(NLU)。现在它已经加速超越自然语言和元数据处理,深入深入分析内容。机器主导的自动化将口述音频转换成可读文本,转录变得近乎实时。我们都看到了Alexa,Cortana和Google语音的早期到来。神经网络训练系统正在取代传统的单词转换,通过增加新的情境和意图相关维度。预计未来3年,AI将完全接管转录和翻译活动,并将驻留在日常使用的音频设备上。
深度视频分析是另一个有趣的领域,通过学习场景变化,位置参考,语音,面部和物体识别,导致视频见解的多方面扩展。这种智能在丰富内容分类和适当标记内容方面有很长的路要走,这提高了内容链接,搜索和关联的准确性。在这里,人工智能通过机器驱动索引,元数据标记,编目等方式显着改变整个内容管理环境,将手动流程转变为高度自动化的工作流程。视频翻译为多种语言和方言以及多语言字幕,有助于将内容的可寻址市场扩大到比以往更多的受众。
2、基于语音的虚拟助理 - 在过去的两年中,像Alexa,Google家庭和语音遥控器(如Siri和Roku)的语音助理已经开始通过完善基本的菜单导航功能来消除笨重的电视遥控器。接下来是在用户跟进命令的帮助下进行内容搜索和发现的情报。使用监督式学习算法的人工智能现在可以为虚拟助手提供动力,将消费者的知识图,地理坐标,语音输入和丰富的内容元数据(演员表,摘要,报价,位置等)结合起来提供个性化推荐。虚拟助手了解语言特征,情感和用户意图的能力使他们更智能,直观和成熟的对话系统增加了更好的客户体验。随着个人数字关系变得更加深刻,
3、优化的视频编码和传输 -引入自适应比特率(ABR)流后,视频流有一个主要的优点。ABR编码将原始文件的小块创建为不同的比特率,以基于可用带宽为客户端提供服务(请阅读此处以了解更多关于流媒体)。通过引入技术来提高固定比特率分块到基于场景的编码,人工智能正在付出更多的努力。人工智能通过学习多个质量度量的场景复杂度,可以确定所需的压缩级别并给出编码视频,系统可以确定帧级复杂度和最佳压缩参数,同时保持质量跟踪。Netflix掌握了这项技术,即使在比特率较低的情况下,也可以生成精确的编码流。这种新的编码方式正在彻底改变为不断增长的新兴经济体观众提供不间断视频的方式,在这些新兴经济体中,手机上的低带宽网络是观看视频的最主要平台。人工智能还通过根据观众位置,网络拥塞等优化所需比特率来提高在线媒体播放器的性能。
4、视觉识别 -面部识别 和物体识别是一个重视视觉处理的AI区域。它涉及视频和静止图像中个人和物体的识别以及随时间的相对变化。虽然这种视觉处理对人类来说是自然而然的,但是机器能够压缩大量数据变化以达到期望的精度水平,这是一项艰巨的任务。最近,人工智能和机器学习越来越能够掌握视觉感知 - 面部和模式识别,为内容编辑和自动化内容创作开辟了丰富的途径。想知道Facebook和众多照片应用程序如何用你的朋友的照片标签做出惊人的工作; 这是所有AI和ML在制作中
5、异常检测 - 在过去的几年中,在线视频不成比例地增长。YouTube,Facebook和在线网络为业余爱好者和专业人士成为内容创作者并接触大众观众创造了无限的机会。今天,对于每秒钟产生的视频和图像数量来说,监控和标记不适当的内容(盗版,暴力,成人等)变得人力不可能。这再次是机器学习服务,在这个领域证明了这一点,大多数网络在上传时创建了基于AI的自动检测工具。Google的云视觉API就是这样一种服务,它可以为标记内容做出适当的改进。虽然假冒内容的创作已经成为人工智能越来越大的威胁,但是这种人工智能技术在限制恶意行为方面来拯救
6、内容指纹识别 - 根据捕获样本内容片段的原则,为识别创建独特的指纹,内容指纹识别在媒体行业已经走过了很长的路要走。随着内容继续随着多渠道分布而不断增长,基于AI的指纹识别技术在应用中发挥了重要作用。一些用例是
通过有效的搜索找到精确和类似的配置文件媒体,Shazam是一个现场模型
使用区块链对内容进行微许可进行付款和跟踪使用情况
识别和跟踪消费者观看行为,衡量广告
广播监视来验证事件发生
内容保护音频,视频和图像,追踪未经授权的分发
7.视频质量评估 - 视频压缩对视频实现合理的传输速率至关重要。但是,压缩是有损的,会引入损伤和伪像等工件。视频质量评估一直是内容分发之前的关键过程,并且随着多通道分布而逐渐扩大。传统上采用两种标准方法,无论是单独使用还是联合使用都用于质量评估。通过播放内容和检查错误以及使用VQM,PSNR,MSE,SSIM等指标进行更加自动化的基于参考的评估,实现基于人工的可视化分析。虽然前者需要大量的人力,但后来在准确性,非实时性以及对参考模型的依赖方面面临挑战。人工智能和机器学习正在通过掌握基于非参考的视频质量评估来改变这一切。人工智能使用广泛的功能集和从错误模式中学习能够提供接近实时的质量评估。在视频工作流程中实现质量控制自动化的巨大潜力,并在缩短内容发布时间表方面带来无与伦比的效率
8.虚拟现实和增强现实 --AR / VR市场潜力巨大,但由于成本,内容成熟度和易用性方面的挑战,该技术在很大程度上表现不佳。虽然虚拟现实(VR)专注于创造360度身临其境的体验,但增强现实技术(AR)处理计算机图形元素与真实世界元素的叠加。对于很大一部分VR / AR应用程序和服务仍然非常粗糙,AI通过提高数据质量和决策制定来带来新的能源。人工智能帮助图像准确无误,更好地理解用户输入和意图,内容关联,情景化以及内容创作,为用户打造更加身临其境的体验
9.后期制作 - 大量的创作过程基于定义的规则和技巧,因此可以通过机器学习算法掌握。人工智能系统可以自动进行剧情识别,场景选择,脚本等各种创作过程所需的地面工作。听说 摩根?去年9月发行的一部基于人工智能的科幻电影与电影主题本身有共同之处。电影预告片虽然由人工编辑完成,但由AI使用IBM Watson提出。在这里,沃森被训练从相似主题的预告片中学习,并选择电影中的关键场景,后来将它们缝合在一起制作最终预告片。一个很好的例子,AI可以选择场景,插入视觉效果,并建立一个令人信服的人类编辑像拖车。以下是AI进入的更多领域
对视频内容进行结构和语义分析,以帮助创建短片视频片段,用于新闻,视频分割以及用于粉丝参与的特殊兴趣内容。
脚本打样,内容清理,场景排序和电影编辑的第一通。给定一个脚本上下文,创建多个具有评分的场景表演供选择
在缓慢移动内容捕捉中进行视频浏览以创建仅供参考的内容
最近IBM与美国公开赛合作,通过认识重要比赛时刻来提供体育亮点。人工智能能够在体育和新闻中快速识别内容并聚合相关内容,这可以彻底改变体育和新闻报道的业务,因为它现在已经存在
10.内容制作
内容结构和基于对象的分析已经开启了人工智能协助实际内容开发的新途径。从屏幕上角色的行为,走动,谈话和所有可能的面部表情的细节中学习,AI系统可以创建虚拟表演。看到如何创造像真正的表演这样的生活真是令人惊讶 - 检查美国总统奥巴马的一个他从未给出的演讲剪辑,留下的想象力很少。人工智能在内容创作领域仍然在不断努力,并且在许多领域它可以使生产过程受益
通过学习流行名人的流行特征,表情,角色和风格,创建虚拟人物角色(仅限数字化身)
使动画电影中的计算机图形工作自动化,取代人为密集的角色动画,但效率更高
概要
人工智能和机器学习有潜力影响基于一系列规则的任何事情,以及机器可以建立和学习模式的地方。AI和ML技术有其自己尚未探索的领域和障碍,但是为实现更大的目标而定位,并承诺具有无与伦比的能力。随着金融服务,高科技和电信业迅速采用人工智能,媒体和娱乐行业在自动化工作流程方面也不甘落后。