AI 金秋将至

最近一段时间,「AI 寒冬将至」、「AI 泡沫即将破裂」的声音此起彼伏。AI 的发展也确实遇到了一些瓶颈,以至于不少人对通用人工智能的实现望洋兴叹。本文作者也认可这些局限的存在,但同时他也指出,如果努力发展以人为中心的人工智能应用,这一领域也将结出硕果。

我们周围关于人工智能的炒作正在逐步降温,接下来我们要关注是将以人为中心的机器学习技术应用于重要问题的大丰收!

我喜欢对关于人工智能的炒作吐槽,下面是前几天的一篇推文:

AI 金秋将至

MIT 展示了一个会玩叠叠乐的机器人(参见:MIT 的机器人会玩叠叠乐了!手残的你怕不怕?)

机器人不会教它自己怎么玩叠叠乐(Jenga)游戏。我到现在也没有读过这篇文章,但有些人决定教机器人去玩 Jenga。人类付出巨大努力开发了一个让机器人能够利用某种数据进行学习的系统。最有可能用到的数据来自于人类的试验,或者可能人们建立了适当的强化机制让机器可以通过「自己玩游戏」来学习。

类似的,在 2020 年之前,汽车也不会自动驾驶。语音识别语音识别也没有达到与人类相媲美的水平。亚马逊的「Alexa」也不是一个对话性的系统。目前的计算机视觉技术不能解决任意的视觉问题。我们还没有面临具有自我意识的杀手机器人的危险。

一些人看到一个又一个曾经的预言失败了,就认为另一个「人工智能的冬天」可能即将到来,但这并不会发生。当年人工智能之所以进入寒冬,是因为尽管有大量的炒作,但是其背后还没有太多的理论支撑。近一段时间以来,在这样的炒作之下也诞生了很多重要的工作。人们认为 Alexa 是一种对话式的智能体,但它实际上只是一个更好的麦克风,是一种在工程中已经被普遍应用的基于规则的系统,而且它确实在某种程度上是由深度神经网络赋能的更好的语音识别系统。「连线」杂志表示,深度学习是贪婪的、脆弱的、不透明的、肤浅的,这些说法没有问题,但是即使有这些限制,很多重要的东西还是可以实现的。

目前实用性的人工智能技术更多地是探讨我们如何形式化定义问题以及我们能收集到什么数据,而不是以新奇的模型为出发点——在技术层面上,今天的「人工智能」是与网络、系统以及数据库息息相关的,正如它与新算法紧密相关一样。最终,人工智能技术还是围绕人类展开的。

AI 金秋将至

人类的表现是「被过度炒作」的人工智能技术的对比基准(也就是说有些方法已经在某些问题上可以与人类相媲美)。然而,被过度炒作的人工智能技术却在很大程度上忽视了与人相关的因素。不过,它们也无法再被忽视了,因为当人工智能技术朝着更实际的应用方向发展而不能取得进展时,与人相关的因素又会重新回到前沿。考虑到人的因素时,炒作就会减弱。当你考虑到除了在光照良好、路况熟悉的道路上行驶,系统还要顾及人类驾驶员面临的其他状况时,自动驾驶汽车似乎不太可能实现。人类驾驶员会寻找乘客,他们会去加油,有时还会去修车,他们要确保喝醉的乘客没有危险,他们要送老年乘客去医院,等等。

我们已经越过了炒作「使用人工智能模仿人类的表现」的时代,转向更实际的以人为中心的机器学习应用。如果炒作是冰山一角的快速融化,那么以人为中心的伟大的应用工作就是漂浮在下方、支撑一切的巨大冰山。

统计模式识别和非确定性的人类

几天前,我在推特上沉思道:如果我们不再将这个领域称为「人工智能」,转而使用更加具体和准确的术语「统计模式识别」,那么现在的这种炒作是否会消失呢?

AI 金秋将至

其他人则有不同的看法——Judea Pearl 认为我们需要能够进行因果推理的新方法,Pedro Domingos 正在寻找「终极算法」,其他人则希望能够超越「与动物相类似的能力的认知功能优化」,并促使我们朝着与人类同等水平的智能进发。

不管它是如何构建的,这些讨论之所以发生,是因为「人工智能」传达了一种智能的概念——人类的智能,这是目前的方法无法满足的。我们的系统往往缺乏常识、跨领域类比的能力、推理因果关系的能力,以及与非确定性的人类进行流畅的模仿和互动所必需的智能的其它组成部分 [1]。

统计模式识别是一个非常强大的工具。为了充分利用这一优势,我们需要进行艰苦的工作,找出既足够重要又足够有针对性的问题,从而使统计模式识别(SPR)方法能够很好地发挥作用。发现重要的问题,将它们映射到从计算的角度来说容易处理的解决方案,收集有意义的数据集,设计对人们有意义的交互,这些都是以人为中心的智能(HCI)及其内在方法的亮点。

HCI 是我认为人工智能这次遭遇的将不是冬天而是秋天的原因。能够应用机器学习技术来解决实际人类问题的人将成为最重要的技术人员。越来越多的易用库能够提供功能强大的机器学习技术;如果你想保持领先,你需要我们在 HCI 课程中教授的技能。

如果你的目标是熬过人工智能的冬天,希望有一天能开发出真正智能的人工智能,那么就打破深度学习和实际应用的束缚,勇敢前行。

如果你的目标是收获丰厚的回报,那么就去学习 HCI 技术吧。

HCI 如何在人工智能的丰收中获利?

HCI 的优势来自对多个学科的结合——至少涉及到计算机科学、设计和行为科学(心理学、认知科学等)。精通 HCI 的人可以使用各种以人为中心的方法来理解现在,设计和实现未来,并验证这些未来的设想。就像在大多数领域一样,从业人员是专门化的。例如,有人可能专门研究当前人们使用的技术,或者专门设计预测性的或刺激性的未来,或者为人们使用的未来技术系统构建原型。

下面,本文将给出一些我认为 HCI(以及相关的)研究和实践将在人工智能的秋天收获颇丰的一些领域,无论未来几十年在真正的智能机器方面会有什么进展,它们都将扮演一定角色:

支撑人类的智能应用

随着机器学习方法被更好的理解,并被更好地打包成工具,最大的挑战将转变为如何将它们应用于实际的与人类相关的问题。这就是 HCI 的优势所在!

在人工智能发展的早期,智能机器的关注点在于智能增强(IA),正如 Vannevar Bush 在「As We May Think」中所描述的那样。我们将 Douglas Engelbart 奉为「鼠标之父」,但他在「Mother of All Demos」中着重讨论了计算技术如何才能够普遍地增强人类智能。Engelbart 对此进行了广泛的讨论。有一段时间,该领域被称为「智能用户界面」,这也成为了该领域的一个著名会议的名称。现在,随着人工智能(以及不切实际的通用人工智能)的局限性逐渐凸显,「人类增强」的概念正变得越来越流行,阅读这本较老的著作是值得的,因为其中的许多见解都具有深远的相关性。

HCI 正在努力解决支持人类的难题——收集和扩展新的数据集;找出人和机器协作的新方法;创造出使设备和世界能更易被理解的系统,无论人的能力如何;为交互和健康创建机器学习技术赋能的传感系统;并致力于打造能够帮助人们更好地创建机器学习模型的系统。

这一领域的挑战和影响与这样一个事实有关,即它的根本目的是创造和解决新的问题,而不是改进现有问题的解决方案。因此,整个过程可以被视为发现和验证一个问题、迭代地提出潜在的解决方案、对这些解决方案进行原型化和精细化、最后验证该解决方案是否解决了预期的问题。

随着机器学习算法被商品化,那些能够在整个机器学习的应用过程中发挥作用的算法将是最有价值的。

设计和人工智能

HCI 的从业人员一直站在前沿,思考人类将如何与人工智能互动,以及如何做一些工作来让人类有效地与人工智能互动。你可以在 90 年代 Pattie Maes 和 Ben Schneiderman(HCI 先驱)之间的「智能体 vs 直接操作」(agents vs. direct manipulation)的辩论中看到这一点。Ben 接着创建了信息可视化领域,从方法论的层面回应人类如何与日益丰富的数据和复杂的世界直接互动。

在人工智能和 HCI 的交叉领域工作的人们很久以前就意识到,构建包含「人工智能」元素的用户界面有一些不同之处,尤其是由于人工智能是不确定的,而且常常是不正确的。Eric Horvitz 和其他人将其称之为「混合主动交互」(Mixed-Initiative Interaction)。你可以在一篇发表在 1999 年的 CHI 会议上的经典论文《Principles of Mixed-Initiative User Interfaces》中读到这一点,尽管我也喜欢下面的这个版本《Mixed-initiative interaction》,其中包括 James Allen 等对话式人工智能大牛的一些评论。Eric 和 Saleema Amershi 等新作者在他们的 CHI 2019 的论文《Guidelines for human-AI Interaction》中对此进行了新的论述。

从某种程度上说,人类往往只在火烧眉毛时才思考,那就太迟了。一位我不确定是否应该提及的同事这样描述:「很多工作都在研究如何给人工智能猪涂口红」。因此,如今设计和人工智能的研究前沿是理解设计师如何才能使用机器学习作为设计材料。其中很大一部分是教设计师如何思考机器学习。这不仅关乎如何将用户接入不确定的人工智能结果:它考虑的是应该解决什么问题;什么机器学习方法与人类预期的问题相匹配;针对于特定的用例,哪些问题可以被很好地解决。

设计正迅速成为同类产品之间的差异所在;因此,那些最擅长机器学习的设计师将提供最大的价值。

计算社会科学

机器学习正在我们所做的每一件事中发挥作用,因此我们需要仔细思考机器学习的意义,以及我们可以做些什么来减轻它的负面影响。计算社会科学家为我们带来的方法往往更倾向于面向对人类的研究,使用 HCI 中教授的各种技术,并借鉴心理学和认知科学等基础领域的方法(如调查、访谈、日志分析和人种学)。

这些技术已经对用户如何理解(或误解)与之交互的算法产生了难以置信的深远影响(例如,Facebook 的新闻 feed 流;YouTube 的推荐系统如何鼓励极端主义;社交媒体虚假新闻的识别机制;用户界面的元素如何影响在线言论;用户对在线隐私的认识,等等)。

HCI 技术在识别或解决此类问题上并没有处于垄断地位,但考虑到我们也是开发者和设计师,它在揭露和干预这些问题上确实有独一无二的地位。

结语

「埋头苦干做好高质量的工作,一切都会好起来,对吗?!」... 总的来说,在人工智能领域,越来越明显的现象是:人工智能的秋天即将到来,为了做好准备,你需要在 HCI 可以大展身手的领域和方法上有所提升

相关推荐