天对地,雨对风,向量对加班?脑洞清奇的对联AI,大家都玩疯了
本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处
本文约1500字,建议阅读6分钟。
人工智能技术应用化日益推进,这次是AI对联。
A:天对地,雨对风。B:大陆对长空。这我也会。A:那你出一个我给你对。B:辣条对什么?A:额,没学过,我先问问AI。B:问出来了么?对联秀,开场
AI说,辣条对香茗。
这是一位名叫王斌的有志青年,开发的对联AI。
出炉之后,网友一股脑儿的都去调戏AI,网站甚至一度要挂。
我也出个认真的上联,考一考它:
突发现场:不会数数
不不不,认真的是这个:
有道理,梅花开的时节确实不一样。另外,平仄也讲究。
增加难度,上联出个有断句的:
山可透光,水不染尘,好一个清明的世界。
如果再配上山花烂漫:
来啊,快活啊。老司机啊,动车驾照拿好了吗?(误)
相信我,开车是个意外。
要成为一名德智体全面发展的AI,除了对诗文,也要常练武。
先来一招,猛虎硬爬山:
名对名,动对动,形对形。矮又与高相映成趣,周全了。
不过,这意思是不想起床?
那可不行,再来一招乌鸦坐飞机。
这次是坐起来了。但好像也坐得太稳了,菩萨啊。
唉,不爱动就躺着吧,十年一觉扬州梦。
阿嘞?这样居然跑起来了,还不是短跑。
体能优异,又有爱国之心,成为栋梁之才指日可待。
不过,他日担当国之大任,还需对人工智能领域拥有清晰的认识,并且掌握专业知识:
额,还是谦虚一点比较好吧。
下面来考学术概念:无监督学习、线性回归、自然语言处理、向量,以及词嵌入。
有法可依;
民心归之;
人生平淡;
不想加班;
我在问词嵌入,你怎么喝上了?
那就趁着微醺,考察一下对学界和产业界的了解吧:
对学术前辈怀有敬畏之情,孺子可教。
伯克利......收回刚才的表扬。
这是说万古流芳的意思么?
你到底信佛还是信道?
好的,你醉了,明天再考。
打哪儿来的AI
这个AI的训练,基于深度学习seq2seq模型,用到了TensorFlow和Python 3.6,代码已经开源,你可以自行到文末传送门找到GitHub页面下载开源代码尝试训练。
目前的对联水平,是在Nivida GTX-1080 GPU上训练了大约4天左右的模型。
不过,这个AI对对联的表现还是要看它的“课本”。训练它所用的数据集来自一位名为冯重朴_梨味斋散叶的博主的新浪博客,总共包含超过70万副对联。
然而,由于我们不知道的原因,这位博主的博客已经无法访问了……
好在,我们还有万能的度娘,度娘在博客弥留之际留下了一些快照,我们发现,这是这位博主编辑的一部名为《联语杂酱面》的书。
看一看这些珍贵的史料,或许你就明白了上面对联AI的文风是怎样习得的了。
另外,博主本人还po出了该系列的目录:
全文不含标点15,153,840字,如果每天看100条的话,22年都看不完。
然而英伟达的GPU四天就看完了……
看完了……
完了……
还有微软的对联AI
我们今天的对联AI作者是一位名叫王斌的小哥哥,本科毕业于黑龙江大学计算机专业,几年后又到英国莱斯特大学读计算机硕士,现在是一名软件工程师。
除了王斌的对联AI之外,AI对联界还有一个著名的作品,来自大名鼎鼎的微软亚洲研究院,是十余年前沈向洋主导的一个研究项目。
微软的对联AI要谨慎且复杂一点,即使你填“辣条”作为上联,它也会给你许多个下联。
还能生成横批。
微软的研究其实是个古董,2004年沈向洋就提出要做自动对联,第二年的春节就已经申请下了专利。
对联AI的第一版早在2006年就已经上线公开了,我们看到的这一版是2008年的第二版,当时在PC互联网时代,未经主动传播的情况下就取得了5W的单日访问量。
来看看微软AI的代表作:
上联:此木为柴山山出下联:白水做泉日日昌横批:景色怡人上此下木,是为柴;上白下水,是为泉。
能对出拆字联,这位AI老先生的文学造诣可见一斑。
究其原理,我们找到了微软亚洲研究院副院长周明博士的博文《微软对联背后的故事》,文中是这样介绍的:
我设计了一个简单的模型,把对联的生成过程看作是一个翻译的过程。给定一个上联,根据字的对应和词的对应,生成很多选字和候选词,得到一个从左到右相互关联的词图,然后根据一个动态规划算法,求一个最好的下联出来。传送门
- 王斌版AI对联
- https://ai.binwang.me/couplet/
- 开源代码
- https://github.com/wb14123/seq2seq-couplet
- 训练数据集
- https://github.com/wb14123/couplet-dataset
- 微软对联
- https://duilian.msra.cn/default.htm
— 完 —
关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。