送你6份最新开源代码！含NLP、ML、计算机视觉方向丨附代码&论文

mxs

2017-11-30

关注关注

来源：PaperWeekly

本文长度为636字，建议阅读3分钟

本文为你分享6份最新的开源代码，包括自然语言处理、计算机视觉和机器学习3个方面。

自然语言处理

DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications

@zhangjun 推荐

#Machine Reading Comprehension

大型中文阅读理解数据集，工作来自百度。

论文链接

https://www.paperweekly.site/papers/1137

代码链接

https://github.com/baidu/DuReader

TransNets - Learning to Transform for Recommendation

@ccclyu 推荐

#Transfer Learning

引入了迁移学习的隐含表示层来减少 test dataset 的稀疏性。

论文链接

https://www.paperweekly.site/papers/1181

代码链接

https://github.com/rosecatherinek/TransNets

计算机视觉

Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering

@xiaolu 推荐

#Visual Question Answering

视觉问答任务（Viual Question Answering）是最近 2-3 年兴起的多模态任务。对于视觉问答任务，算法需要同时理解图片内容和语言信息，然后推理出正确的答案。目前常见的方法有多模态特征融合和以及视觉注意力机制。

已有的注意力机制主要有两类，一类是基于全图区域的注意力机制，一类是基于检测框区域的注意力机制，前者容易关注到物体的一部分，后者会缺少一些检测框。

本文第一次尝试将基于全图区域的与基于检测框区域的注意力机制融合在一个框架下，充分利用全图区域和检测框之间的互补信息；并且提出新的多模态特征融合方法，将问题特征、全图特征、检测框特征进行有效的融合。模型在 VQA 和 COCO-QA 两个主流数据集上实现了目前最好的结果。

论文链接

https://www.paperweekly.site/papers/1175

代码链接

https://github.com/lupantech/dual-mfa-vqa

Image Crowd Counting Using Convolutional Neural Network and Markov Random Field

@cornicione 推荐

#People Counting

文章融合了 MRF 和 deep 网络，提出了一种统计静态图片中人数的方法。

论文链接

https://www.paperweekly.site/papers/1195

代码链接

https://github.com/hankong/crowd-counting

机器学习

Social Attention - Modeling Attention in Human Crowds

@zk5580752 推荐

#Attention Model

本文是一篇基于 Social LSTM 的后续论文，Social LSTM 是李飞飞团队于 2016 年提出的行人路径预测方法。本文则在原文基础上改进了预测方式，不仅仅基于 RNN 模型，还引入了 Attention Model，使得预测更加精准和全面。

论文链接

https://www.paperweekly.site/papers/1115

代码链接

https://github.com/vvanirudh/social-lstm-tf

Breaking the Softmax Bottleneck: A High-Rank RNN Language Model

@paperweekly 推荐

#RNN

本文尝试改进了语言模型在预测 next token 时用 softmax 遇到的计算瓶颈。

论文链接

https://www.paperweekly.site/papers/1112

代码链接

https://github.com/zihangdai/mos

计算机视觉开放源代码 nlp

安科网

送你6份最新开源代码！含NLP、ML、计算机视觉方向丨附代码&论文

mxs

mxs

相关推荐

NLP/CV模型跨界，视觉Transformer赶超CNN?

2020年AI和机器学习的重要趋势是什么？

超赞的PyTorch资源大列表，GitHub标星9k+

图像也能做情感迁移？罗切斯特大学团队提出计算机视觉新任务

5个优秀的计算机视觉应用与相关数据集

4个计算机视觉领域用作迁移学习的模型

AI创业哪家强？6大选择给你方向

可以提高你的图像识别模型准确率的7个技巧

以国家战略科学家身份，顶级AI学者朱松纯回国，筹建北京通用AI研究院

五种图像标注的简介

没有足够多的数据怎么办？计算机视觉数据增强方法总结

人工智能和物联网：智慧城市的交通管理

PG&E使用AI来降低野火风险

为什么AI感知与人类感知无法直接比较？

计算机视觉如何给企业带来不同？

计算机视觉岗常见面试题

TensorFlow2020:如何使用Tensorflow.js执行计算机视觉应用程序？

[ Datawhale ] 计算机视觉下 —— HOG特征描述算子

三个可能会被计算机视觉技术改变的行业

Deep Learning for Image Super-resolution: A Survey

mxs