如何用深度学习训练一个像你一样会聊天的机器人？

luling0

2017-08-25

如何用深度学习训练一个像你一样会聊天的机器人？

聊天机器人到底是什么呢?说白了，就是计算机程序通过听觉或文本方法进行对话。当今最流行的四个对话机器人是：苹果的Siri、微软Cortana、谷歌助理、亚马逊的Alexa。他们能够帮你查比分、打电话，当然，偶尔他们也会出错。

本文主要会详细介绍聊天机器人在文本方面的运作，我们将看到如何使用深度学习模型训练聊天机器人用我们所希望的方式在社交媒体上进行对话。

意图&深度学习

如何训练一个高水平的聊天机器人呢?

高水平的工作聊天机器人是应当对任何给定的消息给予最佳反馈。这种“最好”的反应应该满足以下要求：

回答对方问题
反馈相关信息
问后续问题或用现实方法继续对话

这三个方面是机器人表现出来的内容，而隐含其中没有表现出来的则是一系列流程：理解发送者的意图,确定反馈信息的类型(问一个后续问题，或者直接反应等)，并遵循正确的语法和词法规则。

请注意，“意图”二字至关重要。只有明确意图，才能保证在后续流程的顺利进行。对于“意图”，读者通过本篇文章，将会看到，深度学习是最有效的解决“意图”问题的方法之一。

深度学习的方法

聊天机器人使用的深度学习模型几乎都是 Seq2Seq。2014年，Ilya Sutskever, Oriol Vinyals, and Quoc Le 发表了《Sequence to Sequence Learning with Neural Networks》一文。摘要显示，尽管机器翻译已经做的很好，但Seq2Seq却模型能更好的完成各种各样的NLP的任务。

如何用深度学习训练一个像你一样会聊天的机器人？

Seq2Seq模型由两个主要部件组成，一个是编码器RNN，另一个是解码器RNN。从高层次上来说，编码器的工作是将输入文本信息生成固定的表示。解码器则是接收这个表示，并生成一个可变长度的文本，以响应它。

如何用深度学习训练一个像你一样会聊天的机器人？

让我们来看看它是如何在更详细的层次上工作的。正如我们所熟知的，编码器RNN包含了许多隐藏的状态向量，它们每个都表示从上一次时间步骤中获取的信息。例如，在第3步序中的隐藏状态向量是前三个单词的函数。通过这个逻辑，编码器RNN的最终隐藏状态向量可以被认为是对整个输入文本的一种相当精确的表示。

而解码器RNN负责接收编码器的最后隐藏状态向量，并使用它来预测输出应答的单词。让我们看看第一个单元。该单元的工作是使用向量表示v，并决定其词汇表中哪个单词是最适合输出响应的。从数学上讲，这就意味着我们计算词汇中的每一个单词的概率，并选择值的极大似然。

第二单元是向量表示v的函数，也是先前单元的输出。LSTM的目标是估计以下条件概率。

如何用深度学习训练一个像你一样会聊天的机器人？

让我们来解构这个方程式意味着什么。

左侧指的是输出序列的概率，这取决于给定输入序列。右侧包含p(yt | v，y1，…，yt)，它是所有单词的概率向量，条件是在前一步的向量表示和输出的情况下。其中pi等价于西格玛(或累计求和)的乘法。则右侧可降为p(Y1 | V)*p(y2 | v，y1)*p(Y3 | v，y1，y2)。

在继续之前，让我们先做一个简单的例子。让我们在第一张图片中输入文本：“你明天有空吗?”大多数人都会怎么回答呢?一般都会用“yes”、“yeah”、“no”开始。

在我们完成了网络训练之后，概率p(Y1 | V)将是一个类似于下面的分布。

如何用深度学习训练一个像你一样会聊天的机器人？

再来看我们需要计算的第二个概率，p(y2 | v，y1)表是一个函数，词的分布y1以及向量的表示结果v，而pi将产生最终结果并作为我们的最终反应。

Seq2Seq模型的最重要特性之一是它提供的多功能性。当你想到传统的ML方法(线性回归，支持向量机)和深等深学习方法时，这些模型需要一个固定的大小输入，并产生固定大小的输出。但是输入的长度必须事先知道。这是对诸如机器翻译、语音识别和问答等任务的一个很大的限制。这些任务我们都不知道输入短语的大小，我们也希望能够生成可变长度响应，而不仅仅局限于一个特定的输出表示。而Seq2Seq模型允许这样的灵活性!

自2014以来，Seq2Seq模型已经有了很多改进，你可以在这篇文章结尾“相关论文”部分中阅读更多关于Seq2Seq的文章。

数据集的选择

在考虑将机器学习应用于任何类型的任务时，我们需要做的第一件事都是选择数据集，并对我们需要的模型进行训练。对于序列模型，我们需要大量的会话日志。从高层次上讲，这个编码器-解码器网络需要能够正确理解每个查询(编码器输入)所期望的响应类型(解码器输出)。一些常见的数据集包括：康奈尔电影对话语料库、ubuntu语料库和微软的社交媒体对话语料库。

虽然大多数人都在训练聊天机器人来回答具体信息或提供某种服务，但我更感兴趣的是更多的有趣的应用程序。有了这篇文章，我想看看我是否可以用我自己的生活中的对话日志来训练一个Seq2Seq的模型来学习对信息的反应。

获取数据

如何用深度学习训练一个像你一样会聊天的机器人？

我们需要创建一个大量的对话数据，在我的社交媒体上，我使用了Facebook、Google Hangouts、SMS、Linkedin、Twitter、Tinder和Slack 等着与人们保持联系。

Facebook：这是大部分培训数据的来源。facebook有一个很酷的功能，让你可以下载你所有的Facebook数据。包含所有的信息、照片、历史信息。
Hangouts：您可以根据这个文章的指示来提取聊天数据。
SMS：可以快速获得所有之前的聊天记录(sms备份+是一个不错的应用程序)，但我很少使用短信。
Linkedin：Linkedin确实提供了一种工具，可以在这里获取数据的归档。
Twitter：这其中没有足够的私人信息。
Tinder：这其中的对话不是数据集。
Slack：我的Slack刚刚开始使用，只有几个私有消息，计划手动复制。

创建数据集

数据集的创建是机器学习的一个重要组成部分，它涉及到数据集预处理。这些源数据存档格式不同，并且包含我们不需要的部分(例如，fb数据的图片部分)。

如何用深度学习训练一个像你一样会聊天的机器人？

正如您所看到的，Hangouts数据的格式与facebook数据有一点不同，而linkedin的消息以csv格式进行。我们的目标是使用所有这些数据集来创建一个统一的文件，命名为(FRIENDS_MESSAGE,YOUR_RESPONSE)。

为了做到这一点，我编写了一个python脚本，可以在这里查看。此脚本将创建两个不同的文件。其中一个是Numpy对象(conversationDictionary.npy)包含所有输入输出对。另一个是一个大的txt文件(conversationData.txt)包含这些输入输出对的句子形式，一个对应一个。通常，我喜欢共享数据集，但是对于这个特定的数据集，我会保持私有，因为它有大量的私人对话。这是最后一个数据集的快照。

如何用深度学习训练一个像你一样会聊天的机器人？

词向量

LOL，WTF，这些都是在我们的会话数据文件中经常出现的所有单词。虽然它们在社交媒体领域很常见，但它们并不是在很多传统的数据集中。通常情况下，我在接近NLP任务时的第一个直觉是简单地使用预先训练的向量，因为它们能在大型主体上进行大量迭代的训练。然而，由于我们有这么多的单词和缩写，而不是在典型的预先训练的单词向量列表中，因此，生成我们自己的单词向量对于确保单词正确表达是至关重要的。

为了生成单词向量，我们使用了word2vec模型的经典方法。其基本思想是，通过观察句子中单词出现的上下文，该模型会创建单词向量。在向量空间中，具有相似上下文的单词将被置于紧密的位置。关于如何创建和训练word2vec模型的更详细的概述，请查看我的一个好友Varma罗汉的博客。

我后来了解到TensorFlow Seq2Seq函数从零开始对单词embeddings进行训练，因此我不会使用这些单词向量，尽管它们仍然是很好的实践。

用TensorFlow创建Seq2Seq模型

现在我们创建了数据集并生成了我们的单词向量，我们就可以继续编码Seq2Seq模型了。我在python脚本中创建和训练了模型，我试着对代码进行评论，希望你能跟着一起。该模型的关键在于TensorFlow的嵌入_RNN_seq2seq()函数。你可以在这里找到文档。

跟踪培训进展

如何用深度学习训练一个像你一样会聊天的机器人？

这个项目的一个有趣的地方是，能看到网络训练时，响应是如何发生变化的。训练回路中，我在输入字符串上测试了网络，并输出了所有非pad和非eos口令。

首先，您可以看到，响应主要是空白，因为网络重复输出填充和eos口令。这是正常的，因为填充口令是整个数据集中最常见的口令。然后，您可以看到，网络开始输出“哈哈”的每一个输入字符串。这在直觉上是有道理的，因为“哈哈”经常被使用，它是对任何事情都可以接受的反应。慢慢地，你开始看到更完整的思想和语法结构在反应中出现。现在，如果我们有一个经过适当训练的Seq2Seq模型，那么就可以建立facebook messenger聊天机器人。

如何建立一个简单的fb messenger聊天机器人

这个过程并不是太难，因为我花了不到30分钟的时间来完成所有步骤。基本的想法是，我们使用简单的express应用程序建立了一个服务器，在Heroku上安装它，然后设置一个facebook页面连接。但最终，你应该有一个类似这样的 Facebook 聊天应用程序。

如何用深度学习训练一个像你一样会聊天的机器人？

您可以向您的聊天机器人发送消息(这种初始行为只是响应它所发送的所有内容)。

如何用深度学习训练一个像你一样会聊天的机器人？

部署训练有素的TensorFlow模型

现在是时候把一切都放在一起了。由于tensorflow和node之间还没有找到一个很好的接口(不知道是否有一个官方支持的包装器)，所以我决定使用slack服务器部署我的模型，并让聊天机器人的表达与它进行交互。您可以在这里查看slack服务器代码以及聊天机器人的index.js文件。

测试它!

如果你想和这个机器人聊天，那就继续点击这个链接或者点击facebook页面，发送消息。第一次响应可能需要一段时间，因为服务器需要启动。

也许很难判断机器人是否真的像我那样说话(因为没有很多人在网上和我聊天)，但是它做的很好!考虑到社会媒体标准，语法是可以通过的。你可以选择一些好的结果，但大多数都是相当荒谬的。这能帮助我在晚上睡得更好的，毕竟不能在任何时间用skynet。

如何用深度学习训练一个像你一样会聊天的机器人？

我认为第一个是特别有趣的，因为“juju green”实际上似乎是一种 Juju Smith-Schuster，钢人队宽接收器，和 Draymond Green，前锋金州勇士。有趣的组合。

虽然现在的表现还不太好。让我们来考虑一下改善它的方法吧!

改进方法

从与chatbot的交互中可以看到的改进方法，有很大的改进空间。经过几条信息后，很快就会明白，不仅仅是进行持续的对话就行了。chabtot不能够把思想联系在一起，而一些反应似乎是随机的、不连贯的。下面是一些可以提高我们聊天机器人性能的方法。

合并其他数据集，以帮助网络从更大的会话语料库中学习。这将消除聊天机器人的“个人特性”，因为它现在已经被严格训练了。然而，我相信这将有助于产生更现实的对话。
处理编码器消息与解码器消息无关的场景。例如，当一个对话结束时，你第二天就开始一个新的对话。谈话的话题可能完全无关。这可能会影响模型的训练。
使用双向LSTMs，注意机制和套接。
优化超参数，如LSTM单元的数量、LSTM层的数量、优化器的选择、训练迭代次数等。

机器人深度学习机器学习 text-align 聊天机器人

luling0

0 关注 0 粉丝 0 动态

相关推荐

聊天机器人已成过去式：无法摆脱的命定结局……

笔者并不是指用来打发时间的那种聊天机器人，而是那些能满足高级需求的机器人。你创建聊天机器人的那一刻，就代表着允许客户和你的品牌直接对话。所以聊天机器人的创建不应该是一键默认，而应该是有意识的设置。在已有用户的平台上，聊天机器人能发挥出最大作用。笔者并非是想

quyunfei 2020-11-19

AI与约会：机器如何使我们相遇？

交友APP或许很多人都用过。约会AI的基本目标是为客户配对，直到他们找到理想的伴侣。在很久以前，这个程序还没有这么现代化。通过这种方式，不经了解就与聊天机器人谈话似乎是可行的。报告“机器时代的人类”证实，63%的人倾向于和使用聊天机器人的品牌或企业沟通。如

聊天终结者机器人 2020-11-02

机器人有同理心吗？情感AI的可用性有多少？

说起便携AI应用，很多人会率先想到Siri、Alexa或Google Assistant等语音助手，他们不但可以设置计时器，播放歌曲或轻松查看天气，但要进行真正的人机对话，要如何才能实现?实际上，我们的情绪控制着我们大部分的智力。那么，既然情感是我们最人

zCSDN 8评论 2020-10-20

透过Gartner 2020年人工智能技术成熟度曲线看新的变化

根据Gartner最近的一项调查显示，自疫情爆发以来，有47%的企业组织在人工智能方面的投资维持不变，有30%的企业组织计划增加AI投资。30%的CEO表示，所在的企业组织已经有AI项目，并定期重新定义资源、报告结构和系统，以确保项目取得成功。这些洞察都来

bbf00 10评论 2020-10-16

当教练、做监工…… 人机协同下的AI更懂你

看起来枯燥、高冷的算法，在经过不断迭代升级之后，如何变成可感知外界的人工智能，成为辅助人类决策的工具?在本届进博会上，这一过程有了生动的展示。人工智能可以是“读心”的乒乓球机器人，可以是灵活装配、节省成本的生产线“魔术师”，也可以是瞬间读懂人体密码的“灵魂

机器人智力研究 5评论 2020-11-18

尾款人的双11焦虑症：配送机器人能解？

随着今年双11高潮落幕，尾款人也进入了等快递的煎熬时期。近日，多处快递网点停运的事件，更是让尾款人感到焦虑。而像双11这样的包裹量高峰时期，快递行业人力短缺的问题更加严重，由此导致从配送网点到客户手中的“最后一公里”配送滞后问题愈加严峻。这无疑对用户体验、

聊天终结者机器人 2020-11-18

ROS控制Turtlebot3移动机器人的基础教程

需要注意的是ROS需要IP地址在turtlebot和远程PC之间进行通信

风诰工作手记 2020-11-09

机器狗走梅花桩？自行车能自平衡？腾讯 Robotics X 实验室研究首次“开箱”

11月20日，腾讯公布了其在移动机器人研究方面的新进展：四足移动机器人 Jamoca 和自平衡轮式移动机器人首次对外亮相。这两项进展均来自腾讯 Robotics X 实验室，属于移动方向上的技术突破，也是机器人最基础的能力之一。腾讯 Robotics X

txq0 2020-11-20

诺和诺德携手微软，共创糖尿病智能问答机器人

全球领先的生物制药公司诺和诺德与微软在第三届中国国际进口博览会现场共同宣布，将充分利用诺和诺德在糖尿病预防及治疗领域的丰富知识、能力和经验，结合微软智能云Azure及人工智能技术，共同研发能够提供全中文服务的糖尿病科普知识智能问答机器人——小诺老师，以帮助

zCSDN 2020-11-09

军事机器人可自行决定用轮子还是腿越过障碍物

机器人在环境中移动的最有效方式之一是车轮在相对平稳的地形上移动。然而，当涉及到克服某些类型的障碍物时，轮子并不是最有效的旅行方式。德克萨斯A&M大学的科学家与DARPA合作，为军事应用制造机器人，能够在有或没有人类干预的情况下，确定轮子还是腿更适合

机器人智力研究 2020-11-05

擎朗机器人带您切身感受进博会“黑科技”

浦江潮涌，第三届中国国际进口博览会拉开序幕!“人工心肺”、“88克拉黑钻”、“黑色口香糖”、“抗疫机器人”……除了一些酷炫的展览，今年进博会面积更大、参展企业更多、企业质量更高，话不多说，先睹为快!尽管受到全球新冠肺炎疫情等不利因素影响，但各国企业参展积极

ARMOTO机器人 2020-11-06

人口普查，思必驰AI机器人率先“入户”

“您好,这里是泰达街道人普办。”当前,第七次全国人口普查正如火如荼,天津市滨海新区泰达街道的居民已率先接到了来自思必驰AI机器人的宣传电话,通知辖区居民为即将全面进行的人口普查做好各项准备。对于拥有25万居民、要在30天内完成信息上门采集工作的泰达街道来说

txq0 2020-11-06

破解宇宙奥秘，为何人工智能是关键？

千百年来，人类对于宇宙一直抱有极大的好奇心。仰望天空，你会不禁感叹宇宙之大，那里有太多的东西需要人们去探索和发现。浩瀚宇宙，美丽如斯，宇宙学家和天体物理学家都在尽力揭开宇宙的神秘面纱。卫星每年传送下来数百兆字节的信息，智利正在建设的一台望远镜每晚将产生15

遇见人工智能 11评论 2020-11-03

8500万个工作岗位将被取代，工人如何保住“饭碗”？

2020年初，突如其来的疫情让不少工厂面临着“无人可用”的境地，而一些工厂因为机器人的大量使用，却没有受到很大影响，早早的复工复产，生产秩序稳定。从劳动密集型脱胎换骨，走向智能制造，制造业“机器换人”已成为无法逆转的趋势。随着智能制造技术的发展和“机器换人

clliuhust 2020-10-30

机器人技术如何改变医疗行业

机器人技术在医疗保健领域变得越来越普遍，在生物医学工程领域中，用于医疗机器人的资金也正在增加。它们可以执行超出人类活动范围的精确任务，并在电池允许的情况下持续工作。基于这些原因，医疗机器人可以帮助医务人员从日常和琐碎的工作中解脱出来，并可以使医疗程序更精确

yatou0 2020-10-29

与人工智能做同事，你准备好了吗？

如今在岗学习面临挑战。复杂分析技术、人工智能和机器人突然闯入了职场的方方面面，从根本上颠覆了这一由来已久的有效学习方式。我将这一广泛存在且非正式的流程称为“暗中学习”。我发现了获取所需技能的四大普遍障碍，这些障碍触发了暗中学习。暗中学习者经常意识到他们的做

雨燕 14评论 2020-10-29

AI和ML在网络安全中的用例

随着网络攻击在性质和目标上变得越来越多样化，网络安全人员是否有正确的可见性来确定如何解决漏洞是至关重要的，而人工智能将可以帮助提出人类无法单独解决的问题。“网络安全就像是一盘国际象棋，”Palo Alto网络公司的EMEA首席安全官Greg Day表示。

nodid 14评论 2020-10-29

机器取代人类不是“天方夜谭”，3个岗位“首当其冲”，需警惕

随着科技的不断发展，很多行业都用上了“机器人”，不仅提高了效率，而且节约了人工成本。这里所说的的机器人并不像我们在科幻电影上看到了“仿人类”物件，可能只是一个机械吊臂，或者程序控制的机器装置，依托于提前设定好的程序，可以24小时不间断的进行工作，不仅安全而

yatou0 2020-10-29

95%的消费者在购物时不想和机器人交谈

据backendnews报道，Oracle公司与市场研究公司Wakefield Research和总部位于纽约的零售咨询公司 The Retail Doctor合作开展的一项新研究显示，人们在店内或网上购物时不想与机器人交谈。在这项调查中，针对整个零售环

zCSDN 2020-10-27

为什么说，机器人创业的机会在B端？

技术变革之快，总是超乎保守者的想象。尽管在劳动力人口占比下降，人力成本不断上扬，机器人单价日渐下调等合力作用下，几年前开始中国就已成为全球最大机器人销售市场，但在很多人看来，相较于已初步产业化的工业机器人，当前中国机器人创业的先机会发生在服务领域。从中国电

dhyddy 11评论 2020-10-27

luling0

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号