基于神经网络的命名实体识别 NeuroNER

xdq0

2017-06-14

关注关注

选自Neuroner

机器之心编译

参与：李亚洲

本文主要介绍了一种基于神经网络的命名实体识别系统 NeuroNER，并附上了安装、下载的项目地址，希望对自然语言处理感兴趣的同学有所帮助。

NeuroNER 下载项目地址：https://github.com/Franck-Dernoncourt/NeuroNER

什么是命名实体识别（NER）？

NER 旨在识别文本中的有趣实体，例如位置、组织和时序表达。识别实体可被用于各种下游应用，比如病历去识别化（de-identification）和信息提取系统，也可作为其他自然语言处理任务机器学习系统的特征。

NeuroNER 能做什么？

NeuroNER 是一个能完成 NER 任务的项目：

基于神经网络的命名实体识别 NeuroNER

NeuroNER 相比于已由的 NER 系统，能提供以下优势：

利用神经网络的顶尖预测能力（也就是深度学习）
让用户能够创造新的语料库或修改已有语料库
它是跨平台的、开源的、免费直接使用的

如何使用 NeuroNER?

下图对 NeuroNER 的功能做出了简要介绍，具体描述如下：

训练神经网络完成 NER 任务。在训练的过程中，NeuroNER 允许监控网络。
评估 NeuroNER 所做预测的质量。表现标准可通过预测标签与金色标签的对比来计算、标绘。如果测试集与训练和验证集同时提供，评估也可在训练的同时完成，或者在训练后分开完成，或者使用预训练模型。
部署 NeuroNER 作为产品使用：NeuroNER 标记了部署集，也就是没有金色标签的新文本。

基于神经网络的命名实体识别 NeuroNER

NeuroNER 引擎如何工作？

NeuroNER 引擎基于人工神经网络，特别是依赖一种循环神经网络的变体 LSTM。NER 引擎的人工神经网络包含三层：

字符增强的 token 嵌入（Character-enhanced token-embedding）层
标签预测层
标签序列优化层

下图展现了 NeuroNER 引擎中用到的人工神经网络的架构：

基于神经网络的命名实体识别 NeuroNER

如何安装 NeuroNER

GitHub 上的 repository 解释了安装指南，以下视频展示了使用安装脚本在 Ubuntu 上进行安装有多么简单：脚本会安装你所需的所有东西，然后在 CoNLL-2003 数据集上进行训练。在数个训练 epoch 之后，模型获得了顶尖的成果。

自然语言处理命名实体识别神经网络

安科网

基于神经网络的命名实体识别 NeuroNER

xdq0

xdq0

相关推荐

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

自然语言处理必读：5本平衡理论与实践的书籍

为什么企业应该了解聊天机器人中的自然语言处理？

MIT 推出机器翻译新算法，破译已消失的古语言

NLP：不要重新造轮子

十大针对机器学习的文本注释工具与服务，你会选用哪个？

AI创业哪家强？6大选择给你方向

自然语言处理实战：机器学习常见工具与技术

人工智能的企业家来说，这四个新的方向可能值得重视

人工智能的研究热点:自然语言处理

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

AI写的文章，真的可以骗过老师了

无需「域外」文本，微软：NLP就应该针对性预训练

pytorch+huggingface实现基于bert模型的文本分类（附代码）

NLP中的标识化

基于OpenSeq2Seq的NLP与语音识别混合精度训练

人工智能的8个有用的日常例子

人工智能的三大领域及其工业应用

腾讯AI又创新纪录：ACL 2020入选27篇论文

什么是机器阅读理解？跟自然语言处理有什么关系？

xdq0