人工智能热潮之下的一点冷思考!
这篇文章由Alex Stern和Eugene Sidorin共同撰写。
每天我们的邮箱里都会大量的堆积与人工智能相关的新闻,每周都会有几十篇的文章、意见、概述的标题中都会出现“人工智能”的字样。然而,并非所有的声称与人工智能相关的内容都是有意义的或相关的,而且,通常与该领域完全没有任何关系。
为了使机器学习、神经网络和人工智能的其他部分的知识民主化,我们决定通过创建一系列重点文章来开展我们的工作,这些文章将涵盖该领域的最新进展,看看主要参与者,并提供一些有关最有前景的技术的见解,以及该行业当前面临的机遇和困境。
在这一篇文章中,我们简要概述了我们在2018年看到的关键发展,按主要贡献者、应用和挑战进行细分。
如今,有数百家公司都深入参与了人工智能领域,并试图弄清楚他们与该领域相关的战略,目前,可能比较难以确定最有能力引领未来发展方向的特定参与者,但我们看一下众多参与者列表中的一些,谷歌、Facebook、亚马逊、微软和IBM,似乎最终在各式样的大事件中不可避免的会看到这些名字,(其他几乎同样经常被提及的公司还有苹果(Apple)、腾讯(Tencent)和百度)。在本文中,我们会重点关注微软和谷歌,与2018年一样,它们经常会出现在有关人工智能的新闻中。
谷歌
来自Google博客的Google Pixel:Night Sight功能演示
拿Google在AI领域的努力来说,这是一个富有成效的一年,公司推出的新产品数量以及对现有服务的一些重大改进都证明了这一点。
公告数量最多的是谷歌I/O,该公司在5月举行了年度开发者大会。除此之外,谷歌还推出了Smart Compose for Gmail,为谷歌地图做了一些非常令人印象深刻的更新,也许最重要的是,它宣布推出了新的人工智能虚拟助手,称为Google Duplex(参见所有新产品和功能的一个很好的总结)在2018年的谷歌I / O上推出)。
用公司自己的话说:
“[Google Duplex]是一种新技术,通过电话执行”真实世界“任务用于进行自然对话。该技术旨在完成特定任务,例如安排某些类型的约会。对于这样的任务,系统会使对话体验尽可能自然,让人们能够像对待他人一样正常说话,而不必适应机器。“
由Duplex制作的美发沙龙的电话记录非常令人印象深刻,甚至引起了一些人质疑Google Duplex是否通过了图灵测试(提示:它没有;至少,做出判断的人必须意识到她可能正在和一台机器说话。它还引发了一场激烈的讨论,即如何以这种方式使用技术,而不让接收端的人知道他们没有与真正的人交往,而是与机器人交谈。虽然最终可能很难回答这些问题,但我们可能很快就会看到更多这样的讨论,因为谷歌在去年12月开始向其部分智能手机推出了Duplex。
来自谷歌的另一个有趣的更新来自他们的Pixel系列智能手机(Pixel 3和3 XL)的最新更新,它带来了一些非常令人印象深刻的AI的新相机功能。
最后,由Alphabet公司全资拥有的DeepMind Technologies凭借其AlphaZero计划的最新版本成功实现了一个重要的里程碑。
我们已经在2015年和2016年的Go游戏中看到了AlphaGo和AlphaGo Zero的令人印象深刻的成就,当时它在与两个最强的围棋冠军竞争时轻松赢得了大多数比赛;然而,在2018年,DeepMind的团队成功实现了一些更有趣的东西,最新的AlphaZero引擎展示了它在国际象棋、棋牌和围棋中的明显优势。
AlphaZero特别有趣的是它设法实现了这一壮举,而无需研究人类所玩游戏的任何日志;相反,在只提供基本规则的情况下,该程序自学了如何玩三个游戏。事实证明,AlphaZero不受以往游戏学习的限制,采用了一种不同于以往任何游戏的“突破性、高度动态和“非常规”的游戏风格”。这反过来又使得引擎对社区更有用,然后社区可以通过观察机器开发的策略来学习新的策略。鉴于AlphaZero能够从头开始成功学习并解决完美的信息问题,它还为未来的这项技术创造了实际应用的承诺。
DeepMind还致力于创建可以处理不完美信息问题的系统,因为它最近在 AlphaStar 中成功击败了星际争霸II中的一些职业玩家(而在过去,由于游戏的原因,AI一直难以成功地玩《星际争霸》)就证明了这一点。)
微软
微软Azure营销公司副总裁Julia White在旧金山举行的人工智能事件对话中发表演讲
与谷歌类似,微软在全力开发人工智能游戏的过程中,曾在2018年推出了大量与人工智能相关的新产品和服务,并改进了一些基础技术。这项工作的一个重要部分是以社区为中心,专注于为开发人员提供更好的工具和功能,以便在Microsoft的云平台上构建基于AI的解决方案。
有趣的是,微软Build的开发者大会在5月份发生,就像谷歌一样。在2018年,它一直是微软的盛会,该公司正在发布了大量新公告,特别是宣布了项目Brainwave与Azure机器学习的集成。
Brainwave项目(最初被称为Catapult)是从2010年Bing开始的几年研究的结果。Mombwave于2017年8月在热门的芯片大会上向公众宣布的,其中一个是半导体顶级会议。简而言之,Brainwave是一个基于FPGA芯片上的硬件平台,旨在加速实时AI计算,这是搜索引擎等服务的关键领域(这也解释了为什么这个项目来自Bing)。现在,随着Brainwave与Azure机器学习的集成,微软声称Azure是最有效的人工智能云平台。
在去年9月在奥兰多举行的另一场大型会议Ignite上,微软为企业开发人员发布了Cortana Skills Kit,便于他们使用现有的亚马逊 Alexa 助手技能代码来构建 Cortana 技能。想想你可以为机器人编程以便能够为办公室安排好清洁服务,或者在您的简短语音命令的指导下就将需求自动提交到服务台。
几天后,微软还宣布将实时翻译功能整合到SwiftKey中,这是一款由微软于2016年收购的Android键盘应用程序。最后,在9月底,继Google Duplex领导后,微软发布了其语音服务工具,引入改进的文本到语音合成功能。
11月下旬又发布了一系列有趣的公告,例如Cognitive Services Containers。认知服务允许开发人员在他们的应用程序中利用AI,而无需他们成为数据科学方面的专家,或拥有广泛的AI相关知识。反过来,容器的故事围绕边缘计算的案例展开。这是一个概念,当不需要将数据发送到云来执行计算而是在本地处理时,可以减少延迟并在许多情况下优化成本。借助容器中的认知服务,Microsoft的客户现在可以构建将在Edge位置运行AI的应用程序。
投资
来自CB Insights的人工智能100强创业公司
人工智能空间的投资最近一直在蓬勃发展,尽管Crunchbase合理地呼吁,但很难估计投资的规模。 CB Insights已经构建了一个很好的AI空间信息图,并在本文中对顶级初创公司进行了分类。我们看到两个主要的收获 - 首先,2018年人工智能行业的最大轮次由中国公司筹集,如SenseTime和Face ++(分别为16亿美元和6亿美元)。其次,在今天存在的11只独角兽中,估值为200亿美元+估值,5家公司来自中国,占总估值的50%,SenseTime以惊人的45亿美元估值领先集团。这突出了一个关键点:与其他国家相比,中国似乎正在加快步伐。此外,由于其占地面积越来越大,中国现在正成为人工智能领域的强国。
伦理、法规和教育
深陷假货争议
人工智能从 Verge上生成了奥巴马总统演讲的假片段
2017年12月,Motherboard发布了一个关于Reddit用户名'deepfakes'的故事,该用户正在发布一些色情视频,它主要就是把一些的明星的脸映射到色情明星的脸上。虽然不是很完美,但是这些视频看起来非常可信。很快,Reddit就禁止了这些视频,由此,这项技术的合法性和潜在的讨论也就从那时起开始升温。
通过交换演员面孔制作假视频背后的技术已经存在了一段时间,但创作的容易性和质量在2018年达到了一个新的水平(另见一个技术娴熟的用户可以在这里实现的另一个例子) )。制作假色情影片虽然令人不安,但可能相对无害,但正如我们最近看到的那样,同样的技术可能被用来制作假新闻或制作虚假的宣传材料(或让总统巴拉克奥巴马说出他从未说过的话,至少不在公共场合),这可能会对我们的整个社会产生严重影响。事实是,这些深度假货仍然存在,并且可能只会更难以与真实的东西区分开来。
AI偏见
来自微软博客文章“面部识别:行动的时候到了
在过去几年中,有监督和无监督的学习方法都产生了一些令人兴奋的结果(DeepMind的AlphaZero是通过无监督学习可以实现的一个例子)。尽管如此,大量的实际应用程序仍然需要在标记数据上进行训练模型(顺便提一下,这是经常阻碍进一步进展的关键问题之一)。
但是,拥有一个标记数据的大型数据集来训练模型与拥有一个好的数据集并不完全相同。你看,依赖于监督学习的神经网络与它们最初训练的数据一样好,所以如果底层数据集有任何缺陷(例如以牺牲其他特性为代价关注一个特征),那么很可能是神经网络网络会接受这些偏见并进一步放大它们。这在理论上听起来可能不是太糟糕,但只有我们考虑到在实际应用中产生的可能问题之后- 正如我们在2018年所看到的那样,这些可能是非常深刻的。
例如,在M.I.T.的研究员Joy Buolamwini所做的研究中。她证明微软、IBM和Megvii的领先人脸识别系统对1%的白人男性进行了错误的性别分类,在高达35%的深色皮肤女性中犯了错误。原因是?这些模型是在一个有偏见的数据集上进行训练的,该数据集包含更多比例的白人男性照片,因此在正确识别他们的性别方面逐渐变得更好。考虑到人脸识别技术现在越来越多地被执法部门使用,并且非洲裔美国人被挑选出来的机会最多,因为他们在大量数据库中的比例不成比例,这种性能差异可能会产生非常显著的负面影响。
2018年公布的同一问题的另一个著名例子是与亚马逊内部人工智能招聘工具相关的案例。亚马逊打算利用机器学习功能来实现更有效的招聘流程,并且可能完全自动化一些步骤。不幸的是,事实证明,上面提到的工具是针对以前申请过这家公司的人的简历进行培训的,其中大多数是男性。结果,该模型发现了这些偏见,并反过来训练自己降低女性候选人的等级,优先考虑“男性语言”之类的东西,以促进男性的申请应用。亚马逊最终取消了该工具,但还有很多其他公司试图利用人工智能来帮助招募流程,其模型可能存在类似的缺陷。
今天,越来越多的人(和公司)呼吁当局设计监管框架来管理人脸识别的使用。这会很快发生吗?这还有待观察,但至少会出现某种程度的监管。
优步的自动驾驶汽车在亚利桑那州致行人死亡
优步沃尔沃XC90自动驾驶汽车
不幸的是,即使是最伟大的技术也会在复杂的、不确定的环境中运行时偶尔会出错。因此,在2018年3月18日,不幸的事情发生了,一辆属于Uber的自动驾驶汽车在亚利桑那州坦佩撞上并最终致死了一名行人。这次事故迫使该公司暂停其无人驾驶汽车的所有测试,并重新检查其工艺和技术;它还引发了关于自动驾驶汽车背后技术现状以及道路和监管挑战的热烈讨论,如果自动驾驶汽车要在短时间内获得更广泛的公众认可,就需要应对道德和监管方面的挑战。
九个月后,优步被允许在匹兹堡恢复自动驾驶汽车的测试,其次是12月份在圣弗朗西斯和多伦多,尽管在那些情况下,优步的自动驾驶汽车仍然局限于“手动模式”(这意味着该公司将是专注于将汽车软件暴露在新环境中,而不是积极运行测试。为了再次赢得当局的好评,优步不得不同意对允许运营自动驾驶车辆的道路类型和条件达成额外限制。此外,优步不得不改用一个系统,为驾驶员提供更严格的训练。最后,该公司推出了第三方驱动程序监控系统,并对其技术进行了进一步改进。
不过,在自动驾驶汽车方面,我们似乎不太可能看到有关公共安全和必要法规的讨论结束;相反,优步的不幸事故只会助长正在进行的辩论。我们将看到2019年将带给我们什么;然而,有一件事,我们可以肯定,未来2 - 3年可能会证明在形成关于自动驾驶汽车主题的公众舆论方面,这是至关重要的。
对于那些对自动驾驶汽车的历史和现状感到好奇的人,我们建议您查看有关自驾车的自动驾驶汽车的深入指南(https://www.wired.com/story/guide-self-driving-cars/)。
麻省理工学院投入10亿美元用于新的AI学院
2018年10月15日,麻省理工学院宣布成立一所名为麻省理工学院斯蒂芬A.施瓦茨曼计算机学院的新学院,该学院是Blackstone的联合创始人兼首席执行官。新学院将专注于解决人工智能兴起所带来的全球机遇和挑战。
麻省理工学院已经在该领域拥有非常强大的声誉(更不用说它在AI领域的努力可以追溯到20世纪50年代后期的领域)。尽管如此,仍然很难高估这一最新发展的重要性。例如,施瓦茨曼的礼物将允许创建额外的50个专门负责人工智能研究的教职员工,有效地使麻省理工学院的计算机和人工智能研究人员数量翻了一番。
强调跨学科合作,以及相关政策和伦理的研究,以确保人工智能被负责任地实施,这里也是值得注意的。我们已经看到一些智库和研究计划在最近这几年集中在这些主题创建方面,也得到了麻省理工学院的承诺,因为在这个问题上我们还有很多工作要做。
AI应用程序:计算摄影
来自Business Insider的Prisma应用程序生成的图像
从最广泛的意义上说,计算摄影是过去几年中人工智能最可能取得最显著进步的领域,至少从消费者的角度来看是这样的。前几年该领域取得了很多进展(例如Google Photos学习如何在2015年自动标记和分类照片,或者iPhone 7能够自动模糊以纵向模式拍摄的照片中的背景),在2018年,我们看到了一些特别令人印象深刻的技术成就,从而使其成为大众产品。
Google Pixel的夜视模式或iPhone XS和XS Max上提供的智能HDR等功能只是通过使用机器智能实现的一些功能的一些示例。这里可能更有趣的是,这些新功能现在已经清楚地证明了AI能够实现超出摄像机物理限制的改进能力,从而将整个领域设置在一条新的激动人心的道路上。因此,今天的计算摄影已经证明了它对那些熟悉AI领域中其他进步的人以及远离该领域的用户的价值。
计算摄影应用的另一个方面是当神经网络被用于使用算法完全重写图像,以将输出调整为看起来像著名艺术家的艺术品,例如梵高或莫奈(例如参见Prisma app)。类似的概念用于机器视觉的各个领域,例如,无人驾驶汽车。
编译出品
来源:https://towardsdatascience.com/reflections-on-the-state-of-ai-2018-46504e25263d