LASER 可探索大量多语言句子表征形式的工具 项目简介
LASER 是个计算和使用多语言句子嵌入的库,为的是加速自然语言处理在多语言上进行的零样本迁移。LASER 拥有以下优势:极快的性能,能在 GPU 上每秒处理多达 2000 个句子。句子编码器是在 PyTorch 中实现的,只需要很少的外部依赖。资源有限的语言可以从多个语言的联合训练中受益。该模型支持在一个句子中使用多种语言。随着新语言的加入,系统会学习识别其语系特征,从而使相关性能有所提高。
LASER 是个计算和使用多语言句子嵌入的库,为的是加速自然语言处理在多语言上进行的零样本迁移。极快的性能,能在 GPU 上每秒处理多达 2000 个句子。句子编码器是在 PyTorch 中实现的,只需要很少的外部依赖。资源有限的语言可以从多个语言的联合训练中受益。随着新语言的加入,系统会学习识别其语系特征,从而使相关性能有所提高。