BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

yyy0

2019-02-22

【新智元导读】NLP方向近日各种大神工具层出不穷。然而，实践才是硬道理，如何将它们应用到自己的模型是个关键问题。本文就对此问题进行了介绍。

近期的NLP方向，ELMO、GPT、BERT、Transformer-XL、GPT-2，各种预训练语言模型层出不穷，这些模型在各种NLP任务上一次又一次刷新上线，令人心驰神往。但是当小编翻开他们的paper，每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢？答案是Hugging Face的大神们开源的pytorch-pretrained-BERT。

Github 地址：

https://github.com/huggingface/pytorch-pretrained-BERT

模型简介

近期的各种预训练语言模型，横扫各种NLP任务，这里我们介绍三个最火的预训练模型：

BERT，由Google AI团队，发表于2018年10月11日。它的文章是： BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding。
Transformer-XL, 由Google AI和Carnegie Mellon大学，发表于2019年1月9日。它的文章是：Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context。
GPT-2，由OpenAI 团队，发表于2019年2月14日，它的文章是：Language Models are Unsupervised Multitask Learners。

基本上，每一个文章，都在发表的时候，刷新当时的几乎所有NLP任务的State-of-the-Art，然后引发一波热潮。当然，目前风头正盛的是GPT-2，它前几天刚发表。

开源实现

然而，让小编翻开他们的paper，发现每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢，Hugging Face 的大神们，紧跟前沿，将所有的预训练语言模型都实现并开源了。更令人钦佩的是，它们还做了很多封装，让大家都可以才在这些巨人模型的肩膀上。

Hugging Face开源的库叫pytorch-pretained-bert, 你可以在本文开头找到链接。接下来的部分，我们介绍一下它的安装和使用。

安装使用

你可以直接使用 Pip install 来安装它：

pip install pytorch-pretrained-bert

pytorch-pretrained-bert 内 BERT，GPT，Transformer-XL，GPT-2。

为了获取一句话的BERT表示，我们可以：

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

拿到表示之后，我们可以在后面，接上自己的模型，比如NER。

我们也可以获取GPT的表示：

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

Transformer-XL表示：

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

以及，非常火的，GPT-2的表示：

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

有了这些表示，我们可以在后面，接入自己的模型，比如：

文本分类
https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_classifier.py
阅读理解
https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_squad.py
语言模型
https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_lm_finetuning.py
等等

本文经授权转载自专知

nlp

安科网

BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

yyy0

模型简介

开源实现

安装使用

yyy0

相关推荐

使用NLP创建摘要

为什么企业应该了解聊天机器人中的自然语言处理？

本周六锁定成都！解析百度文心（ERNIE）如何助力快速定制企业级NLP模型

在预训练NLP模型上测量性别相关性

NLP：不要重新造轮子

NLP/CV模型跨界，视觉Transformer赶超CNN?

人工智能的研究热点:自然语言处理

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

自然语言处理必读：5本平衡理论与实践的书籍

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

百度语言与知识技术峰会召开王海峰揭秘NLP技术演进路径

无需「域外」文本，微软：NLP就应该针对性预训练

NLP小白入门篇：莫愁前路，一文读懂语料预处理

EasyDL全新升级，文心（ERNIE）3项能力助力快速定制企业级NLP模型

这款NLP神器火了！关键词提取、结果可视化，从小白进阶大神

达观数据融合自研OCR与NLP技术推出智能RPA<

NLP中的标识化

基于OpenSeq2Seq的NLP与语音识别混合精度训练

腾讯AI又创新纪录：ACL 2020入选27篇论文

一口气发布1008种机器翻译模型，GitHub最火NLP项目大更新：涵盖140种语言组合

yyy0