独家｜为什么要利用NLP做情感分析？

LandscapeMi

2017-12-22

独家｜为什么要利用NLP做情感分析？

作者：申利彬

校对：孙涛

本文长度为1500字，建议阅读10分钟

本文谈论自然语言处理中的情感分析及其在不同行业中的应用。

多数人不能准确把握人类的情感变化，我也不例外，但是计算机却可以做到这一点。基于上面的事实，我们要讲述一件你也许已经熟知的机器学习分支——自然语言处理（NLP）,这听起来很像计算机试图学习并理解我们平时说的“自然语言”。但是我们并不满足于此，我们要做一件神奇的事，那就是“情感分析”。听到计算机能分析人类情感这件事，很多人肯定会觉得有些不可思议，但这正是我们下面要谈论的。

自然语言处理

我们稍微回顾一下，很多程序员都知道人与人和人与计算机交流的方法有很大的区别。例如，当我们写程序的时候必须严格遵守语法和格式的要求，但人与人交流就会自由很多。人与人交流的过程中，可以用不同长度的句子表达相同的含义，同样长度的句子表达不同的含义。你应该意识到这对计算机来说是很复杂的。

随着人工智能技术越来越多的应用到我们的工作和日常生活中，用我们熟悉的语言与计算机交互变的越来越重要。虽然我们总是可以要求“码农”写更多的代码，但是我们不能要求顾客以写代码的方式向Siri咨询天气状况。很显然，顾客用自然语言与Siri交流更高效。

情感分析

自然语言处理只是冰山一角，这是因为人与人交流不是文字或文字堆砌的句子所能表达的，而是一个微妙且复杂的过程。在生活中，你可以根据朋友问问题的语气来判断他的情绪，是无聊、生气或者好奇。即使是在纯文字的聊天中，你也可以根据顾客的用词和标点判断他是否愤怒。又或者，当你读一本书的评论时，虽然评论者没有明确说出他对书的态度，但你可以根据评论内容判断出读者喜欢或者不喜欢这本书。

情感就像是将声调、配套的文字以及语言风格杂糅在一起。要让计算机真正理解人类日常交流用语，单单了解单词的定义是远远不够的，计算机还要理解人类的情感，只有这样才能最终理解人每天的交流方式。

深度学习

在深度学习中，将大量自然语言实例标定为正样本或负样本，然后用这些实例训练网络参数，最后我们会得到识别新样本实例的情感分析模型。互联网论坛越来越受欢迎（基于语音的虚拟助手也日益流行），这给我们提供了充足的语料去训练我们的模型，一旦模型训练好了，就可以用来解决新的问题。

独家｜为什么要利用NLP做情感分析？

举个例子，一般情况下，假设你是在网络课堂学习的学生，你会将困扰自己的问题放到课程相关的论坛上。人工智能的客服就不仅可以确定你困惑的主题，还可以分析你因此沮丧或气馁的程度，并给出合理的反馈。因为人工智能的存在，上面的想法已经变成现实。

情感分析的应用

情感分析可以应用的地方有很多，假如你是一名媒体工作者，你可以爬取网上大量有关电影的评论，训练情感分析模型来了解人们喜欢和不喜欢的电影。假如你在投资部门工作，可以构建有助于预测股票市场的模型，通过人们在论坛中的留言来评估他们对股票的乐观程度。假如你在政府部门工作，情感分析模型会评估人们看推特的演讲时情感变化情分析他们对演讲内容的爱憎程度。难以想象情感分析模型对我们的影响。

独家｜为什么要利用NLP做情感分析？

深度学习工具使得这些变成现实，对于动态预测任务，甚至可以做到实时预测。你可以实现一个演讲者可以看到演讲现场数据分析的界面，这样演讲者可以得到及时反馈，演讲的内容才可能更大限度地引起共鸣。你也可以实现一个自动投资的模型，它根据对不同股票涨跌的持续观察来自主进行投资。你还可以实现一个课堂助手，可以实时提醒老师课堂氛围是活跃还是低迷。

这些是深度学习最令人惊奇的地方，我会在这个领域继续走下去。当然人们很难解释深度学习的深层原理，但是当你想象这项技术的应用时，这些事情就变得非常令我们期待。如果你掌握了深度学习，那将取决于你如何利用它去改变世界。所以，你还在等什么，快加入这场革命吧。

独家｜为什么要利用NLP做情感分析？

申利彬,研究生在读，主要研究方向大数据机器学习。目前在学习深度学习在NLP上的应用。希望能在THU数据派平台与爱好大数据爱好人工智能的朋友一起学习进步。

更多精彩请关注清华-青岛数据科学研究院官方微信公众平台“数据派THU”

自然语言处理 nlp 情感分析

LandscapeMi

0 关注 0 粉丝 0 动态

相关推荐

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 2020-11-05

NLP：不要重新造轮子

自然语言处理是一个令人生畏的领域名称。从非结构化文本中生成有用的结论是很困难的，而且有无数的技术和算法，每一种都有自己的用例和复杂性。作为一个接触NLP最少的开发人员，很难知道要使用哪些方法以及如何实现它们。本文的目标读者是希望将自然语言处理快速集成到他们

熊Ok 2020-10-26

人工智能的研究热点:自然语言处理

人工智能作为新一轮科技革命和产业变革的重要驱动力量，正在深刻地影响世界、改变世界。而自然语言处理已成为AI领域的研究热点，它推动着语言智能的持续发展和突破，并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言：“自然语言处理是极有吸引力的研究领域

hxq 2020-09-23

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

在最新的博客文章中，谷歌公布了一个新的 NLP 模型，在文本分类任务上可以达到 BERT 级别的性能，但参数量仅为 BERT 的 1/300。在过去的十年中，深度神经网络从根本上变革了自然语言处理领域的发展，但移动端有限的内存和处理能力对模型提出了更高的要

熊Ok 2020-09-22

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

无需「域外」文本，微软：NLP就应该针对性预训练

在生物医学这样的专业领域训练NLP模型，除了特定数据集，「域外」文本也被认为是有用的。但最近，微软的研究人员「大呼」：我不这么觉得！这是一个拷问人工智能「门外汉」的灵魂问题。但研究人员将这部分归因于数据中的噪声。

mxs 2020-08-10

NLP中的标识化

从零开始掌握一门新的语言令人望而生畏。如果你曾经学过一种不是你母语的语言，你就会理解！有太多的层次需要考虑，例如语法需要考虑。这是一个相当大的挑战。这就是自然语言处理中标识化的概念。简单地说，标识化对于处理文本数据十分重要。标识化是一种将文本分割成称为标识

NgCafai 2020-06-28

基于OpenSeq2Seq的NLP与语音识别混合精度训练

Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq. 迄今为止，神经网络的成功建立在更大的数据集、更好的理论模型和缩短的训练时间上。为此，我们创建了OpenSeq

bensonrachel 2020-06-21

腾讯AI又创新纪录：ACL 2020入选27篇论文

近日，国际计算语言学协会年会在官网公布了ACL 2020的论文收录名单，共计收录779篇论文。据不完全统计，此次腾讯共有27篇论文入选，投中论文总数刷新国内记录，领跑国内业界AI研究第一梯队。此次ACL 2020的审稿周期相比以往几乎增加了一倍的时间，据最

dynalidan 2020-05-22

自然语言处理的应用前景

自然语言处理是人工智能技术的一个分支，它使计算机能够像人们一样理解、处理和生成语言，并且在商业中的应用正在迅速增长。虽然自然语言处理这一术语最初指的是人工智能系统的阅读能力，但它后来成为所有计算语言学的一种通俗说法。当单击搜索结果时，搜索引索会将其视为对找

熊Ok 2020-04-24

入门自然语言处理（NLP）的门

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。简单点说就是怎样让计算机能够理解人类的语言，以执行如机器翻译、文本分析、情感分析等任务。自然语言处理是人工智能领域比较火热的方向，本人决定入坑是因为听那个谁说，这个方向对数学要求不像计算机视觉那么

bensonrachel 2020-04-20

Python深度学习自然语言处理工具Stanza试用！这也太强大了吧！

众所周知，斯坦福大学自然语言处理组出品了一系列NLP工具包，但是大多数都是用Java写得，对于Python用户不是很友好。几年前我曾基于斯坦福Java工具包和NLTK写过一个简单的中文分词接口：Python自然语言处理实践: 在NLTK中使用斯坦福中文分词

katyusha 2020-04-15

2020年AI和机器学习的重要趋势是什么？

在竞争日益激烈的技术市场中，从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是，人工智能行业发展如此之快，以至于很难跟踪最新的研究突破和成就，甚至很难应用科学成果来实现业务成果。在2020年为了帮助业务制定强大的AI策略，本文总结了不同研究领

BigDataDigest 2020-03-23

NLP（二十二）利用ALBERT实现文本二分类

在文章NLP（二十）利用BERT实现文本二分类中，笔者介绍了如何使用BERT来实现文本二分类功能，以判别是否属于出访类事件为例子。但是呢，利用BERT在做模型预测的时候存在预测时间较长的问题。因此，我们考虑用新出来的预训练模型来加快模型预测速度。ALBER

小发猫 2020-03-04

广告行业中那些趣事系列2：BERT实战NLP文本分类任务(附github源码)

摘要：上一篇广告中那些趣事系列1：广告统一兴趣建模流程，我们了解了如何为广告主圈人群以及如何刻画用户的兴趣度。要想给用户打标签，我们需要构建数据源和标签的关联，也就是item-tag。针对数量较少的app数据源我们可以使用人工打标的方式来识别，但是对于ne

mxs 2020-03-01

突破迁移学习局限！谷歌提出“T5”新NLP模型，多基准测试达SOTA

过去几年间，迁移学习给 NLP 领域带来了丰硕的成果，掀起了新一波的发展浪潮。迁移学习在2018年出现的GPT、ULMFiT、ELMo以及 BERT等成果上初露锋芒，之后又在2019年大显身手，推动了领域内多种新方法的发展，其中就包括XLNet、RoBER

yyhhlancelot 2020-02-25

12 种自然语言处理的开源工具

让我们看看可以用在你自己的 NLP 应用中的十几个工具吧。在过去的几年里，自然语言处理推动了聊天机器人、语音助手、文本预测等这些渗透到我们的日常生活中的语音或文本应用程技术的发展。目前有着各种各样开源的 NLP 工具，所以我决定调查一下当前开源的 NLP

yaohaishen 2020-02-25

12种自然语言处理的开源工具

让我们看看可以用在你自己的 NLP 应用中的十几个工具吧。在过去的几年里，自然语言处理推动了聊天机器人、语音助手、文本预测等这些渗透到我们的日常生活中的语音或文本应用程技术的发展。目前有着各种各样开源的 NLP 工具，所以我决定调查一下当前开源的 NLP

zkq 2020-02-25

NLPer复工了！先看看这份2019机器学习与NLP年度盘点吧

2019 年是机器学习和自然语言处理领域飞速发展的一年。DeepMind 科学家 Sebastian Ruder 从 10 个方面总结了我们在过去的一年中取得的重要进展，对未来的研究方向有着重要的指导意义。对于每个方向，本文都会先总结今年我们在该方向取得的

夏未眠秋风起 2020-02-03

最新书籍《自然语言处理实战》推荐分享，（附电子书+代码下载）

自然语言是人类智慧的结晶，自然语言处理是人工智能中最为困难的问题之一，而对自然语言处理的研究也是充满魅力和挑战的。今天，给大家推荐的一本新书是《Natural Language Processing in Action 》，这本书为我们提供了从基础知识到动

qxconverse 2020-01-06

LandscapeMi

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号