PyText 基于 PyTorch 的 NLP 建模框架 项目简介
PyText 是一个基于 PyTorch 构建的深度学习 NLP 建模框架。PyText 通过为模型组件提供简单且可扩展的接口和抽象,以及使用 PyTorch 的 Caffe2 执行引擎导出模型进行推理的功能,模糊了实验与大规模部署之间的界限。其预训练模型包括文本分类、序列标注等。PyTorch 是一个统一的框架,缩短了从研究到生产的路径,而基于 PyTorch 的 PyText 则着眼于满足 NLP 建模的特定需求。核心特性:- 适用于各种 NLP/NLU 任务的生产就绪模型文本分类Yoon Kim (2014): Convolutional Neural Networks for Sentence ClassificationLin et al. (2017): A Structured Self-attentive Sentence Embedding序列标注Lample et al. (2016): Neural Architectures for Named Entity Recognition联合意图时隙模型(Joint intent-slot model)Zhang et al. (2016): A Joint Model of Intent Determination and Slot Filling for Spoken Language Understanding上下文意图-时隙模型(Contextual intent-slot models)- 支持在 PyTorch 1.0 中基于新 C10d 后端构建的分布式训练- 可扩展组件,可轻松创建新模型和任务- 参考实现和预训练模型论文:Gupta et al. (2018): Semantic Parsing for Task Oriented Dialog using Hierarchical Representations- 支持联合训练