自然语言处理(nlp)比计算机视觉(cv)发展缓慢,而且更难!
1. 抢跑的nlp
nlp发展的历史非常早,因为人从计算机发明开始,就有对语言处理的需求。各种字符串算法都贯穿于计算机的发展历史中。伟大的乔姆斯基提出了生成文法,人类拥有的处理语言的最基本框架,自动机(正则表达式),随机上下文无关分析树,字符串匹配算法KMP,动态规划。
nlp任务里如文本分类,成熟的非常早,如垃圾邮件分类等,用朴素贝叶斯就能有不错的效果。20年前通过纯统计和规则都可以做机器翻译了。相比,在cv领域,那时候mnist分类还没搞好呢。
90年代,信息检索的发展提出BM25等一系列文本匹配算法,Google等搜索引擎的发展将nlp推向了高峰。相比CV领域暗淡的一些。
2. 特征抽取困难的cv
cv的前身就有一个领域叫图像处理,研究图片的压缩、滤波、边缘提取,天天摆弄着一个叫lenna的美女。
早期的计算机视觉领域受困于特征提取的困难,无论是HOG还是各种手工特征提取,都没办法取得非常好的效果。
大规模商业化应用比较困难。而同期nlp里手工特征➕svm已经搞的风生水起了。
3. 深度学习的崛起- 自动特征提取
近些年,非常火爆的深度学习模型简单可以概括为:
深度学习 = 特征提取器➕分类器
一下子解决cv难于手工提取特征的难题,所以给cv带来了爆发性的进展。深度学习的思路就是让模型自动从数据中学习特征提取,从而生成了很多人工很难提取的特征:
4. nlp的知识困境
相关推荐
guojin0 2020-10-08
purgle 2020-06-01
BigDataDigest 2020-03-23
lirika 2020-01-27
文山羊 2020-01-10
saluzirobot 2020-11-05
熊Ok 2020-10-26
hxq 2020-09-23
熊Ok 2020-09-22
MakeRoomFor 2020-08-30
mxs 2020-08-10
NgCafai 2020-06-28
bensonrachel 2020-06-21
dynalidan 2020-05-22
熊Ok 2020-04-24
bensonrachel 2020-04-20
katyusha 2020-04-15
小发猫 2020-03-04
mxs 2020-03-01
yyhhlancelot 2020-02-25
yaohaishen 2020-02-25
zkq 2020-02-25
夏未眠秋风起 2020-02-03