ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

kingson

2019-03-06

关注关注

【新智元导读】ACL今年要火了！根据ACL19机器学习领域主席王威廉(William Wang)的推文，今年论文提交数量将在2800左右。相比去年论文提交数量，暴增81%——史上最大规模NLP会议诞生了！

历史上最大规模NLP会议要来了！

3月4日是ACL 2019论文提交截止日期：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

而在离截止时间仅剩5.5小时的时候，ACL 2019机器学习领域主席、加州大学圣塔芭芭拉计算机科学系王威廉(Wliiliam Wang)老师发出推特表示：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

离ACL 2019提交论文截止时间仅剩5.5小时了，论文ID已经超过了2100。本次大会将会是史上规模最大的一次吗？就剩几个小时了，让我们拭目以待。

而就在这条推特发出1小时后，网友回复说：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

现在已经2300了！

最后，王威廉老师再次发推文表示：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

今年ACL论文编号应该到了2800篇左右。

今年ACL的论文提交数，又将打破历史记录！

提交论文数暴增81%，最大规模NLP会议诞生

ACL 2018的论文提交数为1544篇，而今年若是超过了2800篇，那么增量将超过81%。

无疑将成为近年来最火、规模最大的一次NLP会议。

而“增长”趋势不仅仅是体现在今年：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

从上面的折线图来看，ACL近几年投稿量从大体发展呈现出增长趋势。而较高的投稿量也反映了自然语言处理领域在人工智能浪潮下的火热。

2017年共收到1419篇投稿（包括829篇长文投稿和590篇短文投稿），录用长文195篇、短文149篇，长文录用率为23.5%。

2018年共收到投稿1544篇，最终录用381篇，其中长文256篇，短文125篇，长文录取率为25.1%。

从长文录取率上来看，近两年也是呈现增长趋势。相信ACL 2019的录取率应该也会保持上升态势。

往届热词汇总，今年的关键词，你预测到了吗？

每年ACL基本上都会对进行词云分析：

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

接收论文标题关键词（左：ACL 2017独有，中：ACL 2017和ACL 2018共有，右：ACL 2018独有）

根据对接收论文标题的词云分析，在ACL 2017和2018上持续热门的关键词有：

注意力机制（attention）
网络（network）
知识（knowledge）
序列（sequence）
语言（language）

而在2018的ACL中：

句子（sentence）
词嵌入（embedding）
情感（sentiment）

受到了更多的关注。

交叉（cross）、领域（domain）、无监督（unsupervised）等关键词也在去年上榜，可以看到17-18年，业界有更多的人着手不同领域之间的交叉迁移，以及无监督学习的工作。

而2018-2019年，应该属于NLP的大年。

NLP领域大事不断：

谷歌提出BERT模型：证明了一个非常深的模型可以显著提高NLP任务的准确率，而这个模型可以从无标记数据集中预训练得到；
OpenAI提出GPT-2模型：号称史上最强通用NLP模型，狂揽7大数据集最佳纪录。
......

未来两年，NLP可能会不断爆出类似的刷屏新闻，真的进入一个技术快速发展期。这是NLP研发者的黄金期，这种时期最容易出好的成果。

当然，除了上述两个最醒目的模型外，爱尔兰的NLP研究科学家Sebastian Ruder对2018年NLP领域令人激动的十大想法进行了大盘点。

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

总结一下便是：

⑴无监督的机器翻译翻译（Unsupervised MT）

代表论文：

《基于短语和神经的无监督机器翻译》（EMNLP 2018）

⑵预训练的语言模型（Pretrained language models）

代表论文：

《深度的语境化词语表示》（NAACL-HLT 2018）

⑶常识推理数据集（Common sense inference datasets）

代表论文：

《视觉常识推理》（arXiv 2018）

⑷元学习（Meta-learning）

代表论文：

《低资源神经机器翻译的元学习》（EMNLP 2018）

⑸稳健的无监督方法（Robust unsupervised methods）

代表论文：

《用于完全无监督的跨语言词向量的稳健自学习方法》（ACL 2018）

⑹理解表示（Understanding representations）

代表论文：

《语境化词向量解析：架构和表示》（EMNLP 2018）

⑺巧妙的辅助任务（Clever auxiliary tasks）

代表论文：

《语义结构的句法框架》(EMNLP 2018)

⑻半监督学习和迁移学习相结合（Combining semi-supervised learning with transfer learning）

代表论文：

《基于交叉视点训练的半监督序列建模》(EMNLP 2018)

⑼大型文档的问答和推理（QA and reasoning with large documents）

代表论文：

《叙述答阅读理解挑战》（TACL 2018）

⑽归纳偏差（Inductive bias）

代表论文：

《基于人类注意力的序列分类》（CoNLL 2018）

《语义角色标注的语言学信息的自我注意力》(EMNLP 2018)

今年热夏，史上最大规模NLP顶会——ACL，即将拉开序幕。那么你觉得今年的关键词会是哪些呢？

nlp acl

kingson

0 关注 0 粉丝 0 动态

关注关注

腾讯AI又创新纪录：ACL 2020入选27篇论文

近日，国际计算语言学协会年会在官网公布了ACL 2020的论文收录名单，共计收录779篇论文。据不完全统计，此次腾讯共有27篇论文入选，投中论文总数刷新国内记录，领跑国内业界AI研究第一梯队。此次ACL 2020的审稿周期相比以往几乎增加了一倍的时间，据最

dynalidan 2020-05-22

使用NLP创建摘要

你有没有读过很多的报告，而你只想对每个报告做一个快速的总结摘要?你是否曾经遇到过这样的情况?摘要已成为21世纪解决数据问题的一种非常有帮助的方法。在本篇文章中，我将向你展示如何使用Python中的自然语言处理创建个人文本摘要生成器。基本上，在保持关键信息的

csdnfelix 2020-11-12

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 2020-11-05

本周六锁定成都！解析百度文心（ERNIE）如何助力快速定制企业级NLP模型

继去年巡回公开课后，百度AI快车道将再次锁定天府之国成都！小伙伴们，这周六莫吃火锅喽，一哈去快车道嘛！本周六，百度NLP资深研发工程师将为成都地区的开发者们带来满满的NLP技术干货分享。从文心技术解析到EasyDL实战演练，为你解析如何定制企业高精度NLP

yyhhlancelot 2020-11-04

在预训练NLP模型上测量性别相关性

在过去的几年中，自然语言处理取得了长足的进步，诸如BERT，ALBERT，ELECTRA和XLNet等预训练语言模型在各种任务中均取得较高的准确性。鉴于这样的预训练表示在不同NLP任务中得到广泛采用，作为从业者，我们需要了解预训练模型如何对信息编码以及学习

mxs 2020-10-26

NLP：不要重新造轮子

自然语言处理是一个令人生畏的领域名称。从非结构化文本中生成有用的结论是很困难的，而且有无数的技术和算法，每一种都有自己的用例和复杂性。作为一个接触NLP最少的开发人员，很难知道要使用哪些方法以及如何实现它们。本文的目标读者是希望将自然语言处理快速集成到他们

熊Ok 2020-10-26

NLP/CV模型跨界，视觉Transformer赶超CNN?

在计算机视觉领域中，卷积神经网络一直占据主流地位。不过，不断有研究者尝试将 NLP 领域的 Transformer 进行跨界研究，有的还实现了相当不错的结果。近日，一篇匿名的 ICLR 2021 投稿论文将标准 Transformer 直接应用于图像，提出

cswingman 2020-10-05

人工智能的研究热点:自然语言处理

人工智能作为新一轮科技革命和产业变革的重要驱动力量，正在深刻地影响世界、改变世界。而自然语言处理已成为AI领域的研究热点，它推动着语言智能的持续发展和突破，并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言：“自然语言处理是极有吸引力的研究领域

hxq 2020-09-23

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

熊Ok 2020-09-22

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

深度学习模型的训练就像是「黑箱操作」，知道输入是什么、输出是什么，但中间过程就像个黑匣子，这使得研究人员可能花费大量时间找出模型运行不正常的原因。假如有一款可视化的工具，能够帮助研究人员更好地理解模型行为，这应该是件非常棒的事。近日，Google 研究人员

yyhhlancelot 2020-08-26

百度语言与知识技术峰会召开王海峰揭秘NLP技术演进路径

AI正在向更深层次进化，语言与知识技术的重要性愈加凸显。在演讲中，王海峰表示，“在百度语言与知识技术的布局和发展中，我们始终在注意把握两个趋势，即技术发展趋势和产业发展趋势，并力争引领趋势。”

龙心尘 2020-08-25

无需「域外」文本，微软：NLP就应该针对性预训练

在生物医学这样的专业领域训练NLP模型，除了特定数据集，「域外」文本也被认为是有用的。但最近，微软的研究人员「大呼」：我不这么觉得！这是一个拷问人工智能「门外汉」的灵魂问题。但研究人员将这部分归因于数据中的噪声。

mxs 2020-08-10

NLP小白入门篇：莫愁前路，一文读懂语料预处理

自然语言处理是 AI 皇冠上的明珠，而语料预处理是自然语言处理的基础。如今，NLP 技术可以充当人类和机器之间沟通的桥梁。环顾周围的生活，我们随时可以享受到 NLP 技术带来的便利，语音识别、机器翻译、问答系统等等。现在你可以跟随本文，初探 NLP 技术的

天才幻想家 2020-08-03

EasyDL全新升级，文心（ERNIE）3项能力助力快速定制企业级NLP模型

近日，百度文心重磅发布三项功能，新增定制多标签文本分类、情感倾向分析模型等功能，同时数据管理能力也进一步增强，更好地满足自然语言处理领域开发者需求，开发者可通过百度AI开发平台EasyDL进行使用。在2020世界人工智能大会，百度文心荣获最高奖项SAIL奖

PaddlePaddle 2020-07-30

这款NLP神器火了！关键词提取、结果可视化，从小白进阶大神

如何快速优雅地处理你的NLP数据集？试试这款号称「从小白到大神」的Texthero的工具包。不仅编写界面友好美观，而且功能全面，预处理、表征、可视化样样精通，在Reddit上17个小时内就获得了近1.1k的热度。事实上，Texthero的优雅绝不仅仅在于界

yyhhlancelot 2020-07-06

达观数据融合自研OCR与NLP技术推出智能RPA<

2019 年7月 26 日，人工智能企业达观数据在北京召开“达道至简”为主题的产品发布会，正式推出国内首款自主研发集OCR与 NLP于一体的达观智能RPA。RPA作为一种软件产品和解决方案，在国外市场上已进入大规模发展应用。RPA 的价值在于将企业重复性劳

WarGamesdc 2020-06-30

NLP中的标识化

从零开始掌握一门新的语言令人望而生畏。如果你曾经学过一种不是你母语的语言，你就会理解！有太多的层次需要考虑，例如语法需要考虑。这是一个相当大的挑战。这就是自然语言处理中标识化的概念。简单地说，标识化对于处理文本数据十分重要。标识化是一种将文本分割成称为标识

NgCafai 2020-06-28

基于OpenSeq2Seq的NLP与语音识别混合精度训练

Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq. 迄今为止，神经网络的成功建立在更大的数据集、更好的理论模型和缩短的训练时间上。为此，我们创建了OpenSeq

bensonrachel 2020-06-21

一口气发布1008种机器翻译模型，GitHub最火NLP项目大更新：涵盖140种语言组合

现在，你可以用 GitHub 上最火的 NLP 项目做机器翻译了。没错，就是 Hugging Face （抱抱脸）标星26.9k的 Transformer 项目。在最新更新的版本里，抱抱脸发布了 1008 种模型，正式涉足机器翻译领域。模型涵盖 140 种

BigDataDigest 2020-05-19

安科网

ACL 2019论文提交数暴增81%，史上最大规模NLP会议即将诞生！

kingson

kingson

相关推荐

腾讯AI又创新纪录：ACL 2020入选27篇论文

使用NLP创建摘要

为什么企业应该了解聊天机器人中的自然语言处理？

本周六锁定成都！解析百度文心（ERNIE）如何助力快速定制企业级NLP模型

在预训练NLP模型上测量性别相关性

NLP：不要重新造轮子

NLP/CV模型跨界，视觉Transformer赶超CNN?

人工智能的研究热点:自然语言处理

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

自然语言处理必读：5本平衡理论与实践的书籍

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

百度语言与知识技术峰会召开王海峰揭秘NLP技术演进路径

无需「域外」文本，微软：NLP就应该针对性预训练

NLP小白入门篇：莫愁前路，一文读懂语料预处理

EasyDL全新升级，文心（ERNIE）3项能力助力快速定制企业级NLP模型

这款NLP神器火了！关键词提取、结果可视化，从小白进阶大神

达观数据融合自研OCR与NLP技术推出智能RPA<

NLP中的标识化

基于OpenSeq2Seq的NLP与语音识别混合精度训练

一口气发布1008种机器翻译模型，GitHub最火NLP项目大更新：涵盖140种语言组合

kingson