有点儿厉害!微软人工智能绘图机器人想象力迸发艺术火花
微软正在推出新的人工智能技术,这是一个像是“艺术家”的东西,一个“绘图机器人”。机器人能够创建一个对象的文字描述的图像,但它也为不包含文本的图像添加了细节,这表明AI有一些自己的想象力。
“如果你在Bing搜索一只鸟,你会得到一个鸟的图片。但是在这里,图片是由计算机逐个从像素开始创建的。”微软公司在华盛顿州雷蒙德市微软研究实验室深度学习技术中心的首席研究员兼研究经理何晓东在微软公告中表示,“这些鸟可能不存在于现实世界中,它们只是我们计算机对鸟类想象力的产物。”
研究人员表示,机器人能够生成各种图像,包括从“普通的田园场景”,如放牧家畜,到荒谬的“漂浮的双层巴士”。
微软表示,该机器人已经在配对图像和标题的数据集上进行了训练,使其能够理解如何将单词与图像进行匹配。例如,当标题上写着“鸟”时,它能够学会画一只鸟,并且知道鸟的图像应该是什么样的。
他认为,“这是我们相信机器可以学习的根本原因。”
绘图机器人的技术由两个机器学习模型组成。一个是从文本描述中生成的图像,另一个是使用文本描述来判断生成的图像的真实性。前者试图从后者获得假照片,但后者不想被愚弄。两者结合起来,共同创造更高质量的图像。
它尤其擅长从更复杂的句子中绘制图像。而其他技术可能会从标有“鸟”的标题中画出一只鸟,例如,如果你要求它画一个绿色的皇冠、黄色的翅膀和红色的肚皮,它的“质量”就会下降。这样的话,微软可能会导致产生一种模糊的鸟的印象。
有趣的是,当没有提到具体的细节时,机器人如何填补这段空白,基本上,由于其长期训练数据,它有一点自己的常识和想象力。在鸟类的例子中,即使没有在文本中说明,机器人通常会画一只坐在树枝上的鸟,因为最初给它的图像通常显示类似的东西。
根据最近的一篇研究报告,微软还指出,与现有技术相比,这种新型机器人的图像质量提升了近三倍。
当然,这不是将AI与艺术相结合的第一项技术。
这两者的交集有时会产生出色的结果,比如Google的人工智能吸引了那些有自己的艺术表演的机器生成的图像。谷歌还有一个神经网络,可以猜测你正在绘制什么内容,还有一个自动绘图机器人,并定期详细介绍它在帮助机器学习如何绘制方面的研究。
Facebook也一直在教导神经网络来制作飞机、汽车和动物等小图片,甚至从照片中创建了自己的Bitmoji形象。而Nvidia的研究人员使用A.I.创建了计算机生成的名人。同时,这个领域近来也有一些其他的进步。
对于微软来说,教一个机器人从文本中绘制图像完成了它在这个计算机视觉和自然语言处理领域所做的其他工作。
这包括CaptionBot的自动写入照片字幕的开发,以及可以回答人们询问图像的问题的技术,如对象的位置或属性,这些对盲人有会有一定帮助。至于AI艺术家在现实世界中的作用,微软也有一些想法。
这表明该机器人可以作为画家或室内设计师的素描助手,或者可以作为语音激活照片细化的工具实现。
此外,他还表示,随着计算能力的增强,该技术可能会从屏幕上制作动画电影,从而减少动画师今天所需的手工劳动。但目前技术还没有实现。
如果仔细观察这些图像,他们几乎总是会有缺陷,这表明它们是由机器创造出来的,而不是像人类世界的那种,鸟有蓝喙或者有时候会出现有奇形怪状的香蕉。
然而,微软表示,这款机器人可能代表了AI的里程碑。