阿里算法专家:深度学习进入工匠时代,GraphDL应用范围广
新智元报道
来源:IJCAI Workshop
作者:李静怡
【新智元导读】IJCAI 2018 现场,阿里妈妈以 Ad Tech 为主题举办了 Workshop,阿里妈妈资深算法专家朱小强、高级算法专家林伟,分享了将深度学习引入工业级展示广告和搜索广告领域的创新与探索。
随着人工智能产学研的不断融合,企业与学术会议之间的合作也更加频繁和多样。此前,新智元曾经报道过,IJCAI国际广告算法大赛,中国团队包揽冠亚季军。这个竞赛实际上就是阿里集团与IJCAI的一个合作项目,阿里通过IJCAI的平台吸引更多人关注阿里,IJCAI则通过阿里的大赛吸引更多人关注和支持IJCAI。
IJCAI(International Joint Conference on Artificial Intelligence)被认为是人工智能领域最顶级的学术会议之一,涵盖机器学习、计算可持续性、图像识别、语音技术、视频技术等,对全球人工智能行业具有巨大影响力。
今年的合作竞赛由阿里妈妈承办。作为阿里巴巴旗下大数据营销平台,阿里妈妈身处于阿里巴巴庞大的交易场景之中,在人工智能领域也早有布局,构建了超大规模的学习模型,每天训练近100T的数据,有上千亿的样本。
IJCAI 2018 现场,阿里妈妈以 Ad Tech 为主题开展了workshop。阿里妈妈资深算法专家朱小强、高级算法专家林伟,以展示广告技术的两个最重要技术模块——Matching和Ranking为例,分享了他们在将深度学习引入工业级展示广告和搜索广告领域所做的创新与探索。
深度学习将业界技术迭代提升10~100倍
朱小强在演讲中表示,展示广告是互联网行业的主要营销模式之一。阿里巴巴有各种不同的展示广告形式,比如横幅、单品、信息流帖子等等。每天有数亿的用户访问阿里的系统,团队需要针对每位用户的个性化兴趣偏好,在几十毫秒内,从数千万广告集合中,寻找最优匹配结果进行展示。
超大规模的数据以及问题的高度非线性,对展示广告技术构成了巨大的挑战。过去两年里,阿里妈妈团队创造性地将深度学习引入到展示广告技术中,自主研发了一系列面向工业级尺度的端到端深度模型,推动了展示广告技术的全面革新,达到了世界领先的水平。
朱小强认为,深度学习给工业界掀起了一场生产力革命。在深度学习时代,模型的设计变成组件化,优化的方法变成标准化,而且设计和优化是解耦的。这些特点驱动了以深度学习为代表的AI技术迅速普及,而且将整个业界的技术迭代速度提升了1-2个数量级。
“过去两三年,深度学习在广告、搜索和推荐等核心工业界场景中野蛮生长,掀起了一股1.0的掘金浪潮;未来,我们判断深度学习将进一步完善为工业级基础设施,迈入2.0的工匠时代,技术的发展将由粗犷颠覆转变为精细化打磨。”
朱小强说:“10多年前,机器学习大规模地被引入到核心工业领域,由此开创了一个技术的黄金发展周期,我们预期深度学习技术会继续引领新的一轮技术增长。”
基于图的深度学习方法有广阔的应用空间
林伟在演讲中表示,搜索广告场景下,传统的观点一直认为匹配(Matching)的主要优化目标是寻找最相关的候选广告集。他们团队重新定义了这个目标,认为在电商场景下,Matching的主要优化目标是寻找相关性满足约束下,最符合业务目标(例如期望收益等)的候选广告集。基于对目标的重新认识,最近几年Matching算法的改进,大幅提升了直通车的营收。
林伟介绍,Matching主要问题可抽象为:1)对用户意图和候选广告之间是否可以建立链接的识别,以及2)对链接强度的预测。
图(Graph)是一种非常适合用来刻画这个问题的结构,基于图的深度学习方法在Matching上拥有广阔的应用空间。
目前,阿里妈妈已经构建了一套支持超大规模异构图表征学习的算法,并在Matching上成功落地。未来,他们将进一步深耕图深度学习(Graph-based Deep Learning)的方法及应用。
如今在淘宝场景中,图像因素越来越重要,用户的行为模式也越来越复杂。对于排序问题(Ranking),传统的一些模型在识别用户意图上存在诸多限制,需要更精巧和更强大的模型来更好地理解用户。阿里妈妈团队分别提出了很好的图像网络和记忆网络设计方法,增加Ranking模型识别用户意图的能力,经过实际测试都取得了不错的效果。
同时,此前在戛纳国际创意节首发的AI智能文案,在IJCAI也再度引发关注。这个产品基于深度神经网络的Sequence2Sequence模型,融合了注意力机制、位置编码、copy机制等,让机器模仿人写文案。
朱小强认为,“技术本身并不复杂和高深,但因为做到了从场景的实际需求出发,用技术和算法来驱动优化,也让技术和算法施展出最大的空间。”
本届 IJCAI 大会首席赞助官、悉尼科技大学杰出教授张成奇,阿里巴巴人工智能实验室研究员聂再清也到场做了分享。