DeepPavlov：一个训练对话系统和聊天机器人的开源库

电话机器人开发

2018-02-27

本文介绍了一个构建端到端对话系统和训练聊天机器人的开源项目 DeepPavlov，该开源库的构建基于 TensorFlow 和 Keras，并旨在推动 NLP 和对话系统的研究，提升复杂对话系统的实现和评估效果。机器之心简要介绍了该项目和基本技术，希望实现对话机器人的读者可进一步阅读原项目。

项目地址：https://github.com/deepmipt/DeepPavlov

这是一个开源的对话 AI 库，建立在 TensorFlow 和 Keras 上，其用途是：

NLP 和对话系统研究；
复杂对话系统的实现和评估。

我们的目标是为研究者提供：

用于实现和测试他们自己的对话模型并随后将模型共享的框架；
一系列预定义的 NLP 模型/对话系统组件（机器学习/深度学习/规则系统）和流程模板；
对话模型的基准测试环境和对相关数据的系统性评估。

并为 AI 应用开发者提供：

建立对话软件的框架；
将应用与对应基础建设（通讯、技术支持软件等）相集成的工具。

项目特征

格位填充组件（Slot filling component）：基于命名实体识别（NER）神经网络和模糊 Levenshtein 搜索，以从文本中提取归一化的格位值（slot values）。NER 网络组件根据论文《Application of a Hybrid Bi-LSTM-CRF model to the task of Russian Named Entity Recognition》重新生成了架构，由《Neural Architectures for Named Entity Recognition》中的 LSTM+CRF 架构所启发。

专用分类组件：基于论文《Convolutional Neural Networks for Sentence Classification》中的 shallow-and-wide CNN 架构。该模型允许语句的多标签分类。

自动拼写和校正组件：基于论文《An Improved Error Model for Noisy Channel Spelling Correction》，并使用基于统计学的误差模型、一个静态词典和一个 ARPA 语言模型以校正拼写错误。

目标导向的对话机器人：基于论文《Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning》中的 Hybrid Code Networks 架构。它允许在目标导向任务的对话中预测回应。该模型是相当可定制的：嵌入、格位填充器和专用分类器可以根据需要使用或者不用。

为俄语预训练的嵌入：在联合俄语 Wikipedia 和 Lenta.ru 语料库词向量上进行预训练得到的词嵌入。

聊天机器人

安科网

DeepPavlov：一个训练对话系统和聊天机器人的开源库

电话机器人开发

电话机器人开发

相关推荐

聊天机器人已成过去式：无法摆脱的命定结局……

为什么企业应该了解聊天机器人中的自然语言处理？

AI与约会：机器如何使我们相遇？

机器人有同理心吗？情感AI的可用性有多少？

透过Gartner 2020年人工智能技术成熟度曲线看新的变化

聊天机器人机器学习安全的重要性

人工智能使IT具备改善客户体验的优势

微软聊天机器人专利曝光可模仿用户语言风格和表情

五大创新型AI软件公司，下一个AI独角兽就是你

人工智能和基于机器学习软件解决方案如何改变零售业局面

历史上第一个聊天机器人：200 行代码就能欺骗人类感情

7种不同的使用AI聊天机器人的方式

如何在华为云上部署部署中文聊天机器人

人工智能的失败列子以及未来的挑战与机遇

5分钟内搭建你的第一个Python聊天机器人

2020年对话型人工智能将会如何发展？

人工智能带给中小企业的五大优势

机器人

使用websocket开发智能聊天机器人

从演电影到开车，细数人工智能的五大落地方向

电话机器人开发