独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

在近期举办的“数据科学家成长之道”论坛上,清华大学计算机科学与技术系副教授黄民烈做了题为《人机对话》的演讲,通过探讨人机对话的典型技术、交互范式、所面临的挑战及所带来的价值,了解人机交互中的认知、情感捕捉,以洞察人机对话的未来方向。

后台回复关键词“1028”,下载完整版PPT

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

黄民烈,清华大学科学与技术系副教授,清华大学工学博士。研究兴趣主要集中在深度学习、机器学习应用、自然语言处理、自动问答、人机对话、情感分析等。

演讲内容精华经数据派整理如下:

人机对话研究怎么让计算机跟人一样自如交谈。在场的老师和同学大多都用过“小冰”,由于背后充足的技术、团队和资金支撑,它在对话方面做得就很不错,但是事实上它还存在诸多的问题,比如一致性、身份个性等。由此你可以看到这样一个非常具有挑战性的问题,有些人说倘若把人工智能比喻为“皇冠”,皇冠的明珠就是自然语言处理,而明珠中最亮的那颗,就是人机对话。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

讲人机对话可以追溯到图灵测试。如果能通过图灵测试,就认为这个机器具备跟人一样的智能。IBM Watson知识问答的系统,在当时引起很大的轰动,后来其被用于各个行业。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

人机对话是一种新的人机接口,通过语音可以实现跟智能系统的有效交互。所以我们知道人机对话是新的范式的转变。在传统计算机的鼠标键盘,手机的触控就是很便捷的人跟机器的交互方式。比如微软在做的一个CAAP,把语音作为跟机器对话的一个基本的接口,将来的APP就隐藏到后台去了,我们可以通过语言理解方面去完成我们想要做的一些事情。

我们可以回顾一下虚拟的对话机器人,可以通过文字输入、输出,或者语音输入、输出的一个机器人,存在于网络世界而没有实体。从Eliza(做心理咨询的)到ALICE到QQ聊天机器人、小冰。还有很多实体机器人,比如说情感机器人Pepper,它是一个人形机器人,有一定的情感识别和表达能力,包括MIT的Jibo可以在家庭里执行一定任务,这些机器人可以进行一定的助理工作,同时还可以跟家庭成员进行一个有效的互动。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

这样一些对话机器人真正进入到千家万户是一个非常难以解决的问题,具体体现在以下两个方面。第一,要真正理解它的语意很难。第二,它的逻辑非常重要。你对话的时候,有很多常识的问题、逻辑上的问题怎么样去解决?包括一致性的问题,交互性的问题,而你在交互过程中怎么能跟用户有很好的互动、情感的理解,也是研究里的一些重点。其中涉及到你怎么生成高质量的答复,我们前面演讲说判断一个文章是人还是机器写的,对话里也面临这个问题:怎么给它一个身份、个性、人格,包括怎么样去理解和表达情感,包括怎么样去主动跟机器进行对答,不仅仅是被动的应答。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

这是一个深度学习的模型,在微博上面训练出来的。当人们说话的时候,机器可以答复出来。它要真正做到深刻理解是非常困难的事情。另外,没有固定的身份和人格也是很大的问题。这里边有两类基本的技术,一个是基于检索的技术,需要一个很大的数据库,存储一些问题和答案。当新出现一个问题时,去这个库检索一个跟它最接近的问题,把那个问题的答案作为新问题答案的返回。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

我们做的工作分布在几个方面,其中一个是怎么样让机器人表达情感和感知。比如说MIT在1997年提出来的情感计算,以及心理学研究中情绪的智能。它是一种很重要的人类的智能行为,而它要能够很好地去表达情绪上的响应。在某种程度上,这就是情商的一方面。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

在情绪类感知和表达部分,我们研究了怎么样在语音语调上感知。比如你不高兴的时候你会怎么说话,你很开心时候怎么说话。另一方面通过你的面部表情,比如皱眉、或者开心的笑。我们做的是怎么样在文字上表达它的情感,是比前面要更加隐讳的一个表达方式。其中一个方法是从微博里面抓取微博互动的数据,利用标注数据训练一个情绪的分类器,这个情绪分类器会把数据标记为喜怒哀乐的类别,然后把这些数据送到深度学习生成模型里面。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

我们在这里面考虑三个方面的因素:第一,把情绪类别编码成一个向量,可以用记忆网络建模情感内部状态的变化;另外,可以对情感表达进行一个显性的选择,生成一般意义的词。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

另外我们在机器人身份上、个性嵌入上做了工作。假设我们机器人确定一个身份,它就是一个三岁小男孩儿,喜欢动漫又能弹钢琴,这样的人设下能不能够生成一个很好的答复,跟他的身份一致的答复?这个问题很有挑战,你没有足够的数据去训练这样的模型。我们是用海量微博互动的数据。这种情况下你应该用人设的数据来回答问题,并且根据这个人设资料进行很好的答复生成。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

人机对话的未来方向,比如怎么去做类人机器人,你如何教会机器人学习记忆的时候,也在不断累积它的知识,这是很有意思和挑战的事。

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

独家|清华黄民烈:人机对话的典型技术、面临挑战和发展方向

关注官方微信公众平台“THU数据派”,后台回复关键词“1028”,下载完整版PPT

相关推荐