AI炒A股行不行?现在正处于AlphaGo阶段
新智元报道
编辑:克雷格
【新智元导读】“2018 全球智能投资峰会” 昨天结束,峰会由中国证券投资基金业协会金融科技专业委员会主办,易方达基金、华夏基金、通联数据、阿里云、新智元协办,主要探讨了大数据、AI 等前沿技术在金融行业的应用。中国万向副董事长、通联数据董事长肖风,新智元创始人兼 CEO 杨静女士等嘉宾做了重磅演讲,本文为演讲干货集锦。
AI 又一次试图改变中国股市。
昨天,2018 全球金融数据探索与发现大赛(FDDC)的决赛正式举行,6 支队伍利用 AI 对上市公司进行营收预测和对上市公司公告进行信息抽取,探索了 AI 的模型算法如何改变资产管理的未来。
FDDC 大赛是全球首场专注金融领域、深入投资实战的技术大赛,也是 “2018 全球智能投资峰会” 的最核心的看点之一。
“2018 全球智能投资峰会” 今年是第三届举办,由中国证券投资基金业协会金融科技专业委员会主办,易方达基金、华夏基金、通联数据、阿里云、新智元协办,主要探讨了大数据、AI 等前沿技术在金融行业的应用。
在峰会上,基金业协会领导,中国证券投资基金业协会金融科技专业委员会主席、中国万向副董事长、通联数据董事长肖风,新智元创始人兼 CEO 杨静,微软亚洲研究院副院长张益肇,百度北京大数据实验室主任浣军,通联数据智能投研总监盛元君等嘉宾做了精彩演讲。
以下对嘉宾演讲和决赛选手答辩做精华集锦。
AI 影响投资管理行业还处于 AlphaGo 阶段,下一阶段是 Alpha Zero
首先是肖风《涌现论与智能投资》的演讲。
中国证券投资基金业协会金融科技专业委员会主席、中国万向副董事长、通联数据董事长肖风
什么是涌现论?
涌现论是一种研究方法,所谓的 “涌现论” 就是认为互联网所带来的复杂系统、复杂网络,在一个开放系统的环境里面,参与者的互动会面临很多随机性的因素,这些随机因素会决定事物的突变,因此这个系统被认为是非均衡的、不可测的。
涌现论对应的是还原论,还原论的方法认为过去是能够证明现在的,而且也是能够预示未来的,并且任何事物都是有序地、结构化地在运行,所以人们总是能够还原它。
人们现在熟悉的投资管理的理论,大部分都还是基于还原论建立起来的。但是 AI 时代可能会让人们在涌现论的方法之下,来重构投资管理一整套的理论。
“所以 AI 必将在某一年,真正给我们资产管理行业带来很大的颠覆。”
肖风认为,AI 影响投资管理行业可以分成两个阶段,借用人机围棋大赛来比喻,就是从 AlphaGo 到 Alpha Zero 的阶段。
AlphaGo 阶段,AI 起到的作用有三点:
- 帮助人们进行海量数据的处理和另类数据的获取以及另类数据的分析;
- 利用知识图谱、自然语言理解、智能搜索等等工具,提升人们的能力;
- 辅助分析员和基金经理,将人的能力的加强。
第二个阶段是 AlphaZero。这一阶段 AI 注重强化学习、深度学习、迁移学习,从宏观经济、基本面、市场情绪、交易指标四个方面,解构并重构整个市场,以 “预测性” 和“决策性”表达机器的观点。
肖风认为,AlphaZero 阶段是未来五年到十年会出现的一个新的阶段。
而 AI 未来可能对投资管理行业带来的影响有三个层次:行业变革、商业变革和整个资本市场。
以行业变革为例,如果将来智能投资技术成熟,有一天人们会看到智能投资可能会取代被动投资,在 AI 等技术的帮助之下,行业重归主动投资。
未来已经到来。
在过去的两年时间里面,大量的人工智能科学家都加入到了金融行业,这批名单包括 NASA 首席数据科学家加盟贝莱德,微软首席人工智能学家邓力加盟 citadel,华盛顿大学计算机教授 Pedro Domingos 加盟 DE shaw,卡耐基梅隆大学计算机系主任 Manuela Veloso 加盟摩根大通。
这一名单还会加长。
AI 摩尔定律造就伟大公司,产业生态投资将成王道
经济是技术的反映,AI 底层技术将深刻改变商业和投资格局。
OpenAI 今年 5 月发布的 “AI 与计算” 的分析报告显示:自 2012 年以来,在最大的 AI 训练运行中所使用的计算力呈指数增长,每 3.5 个月增长一倍,相比之下,摩尔定律的翻倍时间是 18 个月。自 2012 年以来,AI 算力指标已经增长了 30 万倍以上。
新智元创始人兼 CEO 杨静在演讲中指出,由于半导体设备厂艾斯摩尔(ASML)确认 1.5 纳米制程的发展性,这使得支撑摩尔定律延续至 2030 年,AI 的摩尔定律有着硬件支撑基础,因此还会有持续增长的潜力。
新智元创始人兼 CEO 杨静女士
另外,我们当前处于量子计算爆发前夜,量子计算可能在数十年内将成主流,目前,百度、阿里、腾讯、华为都在布局量子计算业务。未来社会将进入从移动互联网走向超级云计算和万物智联网的阶段,这将为总体算力提供上亿倍的增长速度,也是支撑 AI 摩尔定律的强大动力。
AI 摩尔定律反映到企业上,行走在 AI 摩尔定律下的企业与行走在摩尔定律下的企业有着截然不同的表现。
不到 1 万名员工的英伟达三年前的股价徘徊在 20 美元左右,如今已经涨到 249 美元,三年翻了十倍,它崛起的背后是庞大的 AI 算力需求。而老牌芯片厂商英特尔拥有近 10 万名员工,人均产能却低于英伟达。
“摩尔定律造就英特尔,AI 摩尔定律造就英伟达。” 杨静指出。
在 AI 生态构建中,云的能力很重要,全球排名前 5 的科技公司,如亚马逊、谷歌、微软等,都要转型成 AI 云公司。
谷歌云:39 亿美元巨额投资 AI,建立庞大 AI 生态圈。
软硬件 + 开源框架定制体系聚揽天下英才塑造庞大的开发者社区生态圈。
亚马逊云(AWS):构建 AI 云生态闭环。
AWS 是全球公共云市场的领导者,凭借其可扩展性和全面的平台服务,AWS 是开发和部署云和 AI 应用最领先的云环境之一。采取开发者 & 企业客户两者并重的策略,目前占据市场第一份额。
微软 AI 云:主打企业客户市场,多种 AI 服务组合。
微软在商业环境中拥有大量客户,也有丰富的云 + AI 服务组合,让微软成为 AI 云市场的佼佼者。尤其是在企业客户市场,微软坚持使用 Windows,Office 365 或 Dynamics 365 等产品扎根全球生态市场。
具备大量数据,这些数据流可以用于训练机器学习算法和构建神经网络。
以后人类会进入什么样的阶段呢?杨静认为未来会从移动互联网的阶段走向超级云计算和万物智联网的阶段。在这样的背景下,2018 年做 AI 投资最核心的是要从散户投机到产业生态投资,拥有软件、硬件、核心技术、生态系统的公司可成为 “富可敌国” 的投资巨头。
目前,从 BAT、华为,到谷歌、微软,都在围绕着深度学习 AI 云的软硬件系统,打造未来的开发者生态体系,也是合作的生态。以华为为例,华为的安卓绿色联盟就有 50 万的开发者,华为每一台手机更新到新版,需要 1.2 亿行代码,其中华为做一半,谷歌做一半。
具体到 AI 对金融领域的影响,杨静认为,未来人工智能在保险、证券等领域还有大量场景可以挖掘,例如信用评估和智能赔付等等。
AutoDL 用深度学习来设计深度学习网络结构,帮中小企业降低 AI 使用成本
AI 在逐步改变着金融业,但是企业应用 AI 也面临着不少问题,最主要的问题就是成本。
以 ImageNet 挑战为例,随着时间的推移,人们在 ImageNet 上的错误率越来越低,这背后的神经网络结构也越来越复杂,对设计师的要求也越来越高。
对于一个初创企业来说,很难找到世界顶级的算法工程师来帮助设计网络,并且现在 GPU 集群也越来越贵,如果想打造一支强大的算法团队,企业需要一个强大的工程团队,需要有硬件、软件支持。
小企业如何拥有自主设计神经学习网络的能力?
浣军教授今年年初加入百度任大数据实验室主任,重点研究基于大数据的基础算法和机器学习、数据挖掘、知识发现等技术。在百度,浣军教授主要负责百度 AutoDL 的研发。
百度北京大数据实验室主任浣军
AutoDL 的目标是用深度学习来设计深度学习网络结构,从而达到深度学习网络设计定制化、自动化、便捷化。AutoDL 包含了 3 个方向:
- AutoDL Design: 自动设计全新的深度学习网络结构
- AutoDL Transfer; 迁移原有的网络至新的应用
- AutoDL Adaptation: 针对不同的端,例如手机, 将网络结构进行优化
目前,AutoDL 设计的网络在公共测试集 CIFAR 10 超过绝大多数人类专家设计的网络效果;与百度 EasyDL 团队合作,通过网络优化 + 迁移学习,在所有测试的样例中均可以提升效果,分类正确率绝对值提高 5%~10%;AutoDL 设计优化的网络在手机端等资源有限环境下的部署,模型参数下降 6~10 倍, 预测时间减少 3~6 倍, 模型准确率几乎不变。
AI 解决投研三大痛点,联邦迁移学习解决 AI 数据困境
通联数据智能投研总监盛元君在演讲中提到,AI 等技术的出现驱动众多机构利用 Fintech 重构业务模式,人工智能在某些问题上的效率速度上优于人工。
通联数据智能投研总监盛元君
总体而言,人工智能时代技术发展解决投研三大痛点:决策过程与逻辑统一、提高信息收集和处理的效率、系统化应用提高管理能力。
要实现智能投资研究能力体系的构建,不是单纯的数据整理就可以实现,通联数据通过数据整合 - 技术处理 - 金融投研深度模型化 - 投研应用 - 协同应用等五个方面,逐步实现投研服务能力体系的搭建。
微软亚洲研究院副院长张益肇讲到了用 AI 助力数字化转型,提供精准金融服务。
微软亚洲研究院副院长张益肇
数字化转型有四个大方向,更好地与客户互动、激励员工、运作优化、转型产品。比如说,金融行业已经有越来越多的公司用 AI 帮忙分析股票或与客户互动。
以客户互动为例,微软智能云能够分析人的表情,然后判断人类的情绪。小冰是强调跟用户情感联系的机器人,因此小冰这种情感联系机器人的对话在与客户互动中感知客户情感。
张益肇透露了一组数据:小冰跟用户的对话逐渐的增加,跟用户的对话多到 23 个来回,一般的数字助理通常一两个来回就结束了。
美国世纪投资首席投资官 Vinod Chandrashekaran 认为,投资管理领域正在经历一个代际转变,主要变现在 Alpha 变得越来越难以提取,但好的一面是,数据和技术也在迅速发展,大数据越来越多地用于搜索 Alpha,技术也成为了一个 Alpha 的引擎。
美国世纪投资首席投资官 Vinod Chandrashekaran
不过,在技术的大发展之下,未来投资管理将继续风格趋同,传统的管理者将寻求利用技术提高效率,量化基金经理将越来越需要获取非传统的数据来源,以保持其投资优势。
数据对金融乃至 AI 的发展至关重要。国际人工智能联合会(IJCAI)理事会主席杨强教授认为,大数据驱动下的 AI,面临两大困境:一是隐私、安全和监管困境,另一个是小数据、弱监督困境。
国际人工智能联合会(IJCAI)理事会主席杨强教授
针对第一个困境,杨强教授提出联邦学习(Federated Learning),联邦学习是在保护数据隐私、满足合规要求的情况下出现的机器学习趋势,主要目的是在数据不共享的前提下,利用双方的数据实现模型增长。
针对第二个困境,杨强教授认为迁移学习是解决的方法。以斯坦福大学为联合国做的在卫星地图中标记非洲大陆贫困地区为例,在过去,做法是派人去现场进行经济调查,斯坦福大学用到了迁移学习的方法来解决问题。
研究人员先对白天的卫星图片进行语义级别的分割,标出桥梁、建筑物等,接着以夜间灯光明亮度表示地区的经济发达程度,第三步是根据勾画出来的地区做一个拓展,最后在识别贫富程度上达到和现场调查人员相近的准确率。
全球首场金融领域 AI 大赛终极对决,10 支队伍瓜分百万奖金
“2018 全球智能投资峰会” 上重磅的环节还包括 2018 全球金融数据探索与发现大赛(FDDC)决赛。
FDDC 是全球首场专注金融领域、深入投资实战的技术大赛,由中国证券投资基金业协会(以下简称 “基金业协会”)金融科技专业委员会主办,易方达基金、华夏基金、通联数据、阿里云共同承办,旨在挖掘更多顶尖算法人才将全球先进的大数据、云计算、人工智能等科学技术应用到金融行业和资产管理行业,提升行业对科技的应用和实践能力,打造科技创新服务资产管理行业的新生态。
本次大赛包含两大极具代表性的赛题:上市公司营收预测和上市公司公告信息抽取,大赛共吸引全球 4231 支队伍、共计 4804 名选手参与,参赛人员多来自北京大学、浙江大学、上海交通大学、斯坦福大学、MIT、牛津大学等众多海内外知名院校。
经过初赛和复赛两轮评比,每个赛题分别选拔出五支队伍进入决赛,并分别评选出前三名给予奖金鼓励,获奖团队还可获得全球顶尖金融及科技公司高管的直聘机会。
历时 3 个多月,4231 支队伍经过线上初赛和复赛,共有 10 支队伍进入决赛,于 8 月 29 日在北京进行现场答辩,8 月 30 日,两道赛题的前三名共 6 个团队参加了终极对决。
比赛结果是:
赛题一(上市公司营收预测)
第一名:Alassea lome 团队
第二名:Quant_duet 团队
第三名:智能金融团队
大赛评委之一,香港科技大学副教授、惠理投资中心副主任尤海峰点评:
尤海峰
智能金融团队根据财务报表相互关联的特点,创造性的把 GPDT 和 DNN 两种算法结合起来,先用 GPDT 的算法自动的构造组合特征,在此基础上结合 DNN 深度学习的方法进行预测,取得了很好的效果。
FDDC 大赛上市公司营收预测赛题第三名智能金融团队
Quant duet 团队首先把财务数据进行了拆分,把历史的营收和其他的财务数据给分割出来,剔除了历史营收的财务数据,构建了多因子的预测模型,然后又把单独拿出来的历史营收数据和市场数据相结合,用一个全连接网络深度学习的模型做预测,最后把两个预测模型给整合起来。
FDDC 大赛上市公司营收预测赛题第二名 Quant duet 团队
这种数据拆分其实是提高了两个模型的独立性,从而在整合的时候、融合的时候能够达到分散错误的效果。
Alassea Lome 团队展现了机器学习算法和领域知识很好结合起来的能力。首先他们对数据做了很好的理解、很好的处理和去噪音各种各样的处理,然后根据他们对不同类型的公司理解,在特征选择上和算法选择上都进行了个性化的处理,从而达到很好的预测效果。
FDDC 大赛上市公司营收预测赛题第一名 Alassea Lome 团队
回到赛题上来讲,公司营收反映了公司的指标和公司管理层的行为,如果我们能够再更深的层面上,把金融科技、机器学习算法和相关的经济与会计的原理进行更深层次的融合的话,能够有更好的结果。
目前不管是从业界也好,还是学术界也好,还是处于比较早期的阶段。随着行业知识图谱的建立,我们会在融合方面可能会做得更好,并取得更大的进展
赛题二(上市公司公告信息抽取)
第一名:GOGOGO 团队
第二名:Heisenberg 团队
第三名:Miyabi 团队
最具创意极客奖:东风又绿江南岸团队,智能 ABC 团队;
最具潜力极客奖:KingofWind 团队,ASD123 团队;
通联数据 CEO 王政点评上市公司公告信息抽取赛题复赛前三团队:
王政
Miyabi 团队用表格和分类的方法来抽取,能够快速抽取结果;分类的方法能判断哪些可以抽取。
FDDC 大赛上市公司公告信息抽取赛题第三名 Miyabi 团队
Heisenberg 团队有两个亮点:1、有实用价值的系统架构,能很快用到工业界。2、在实体识别的方法比传统的有很大提升。
FDDC 大赛上市公司公告信息抽取赛题第二名 Heisenberg 团队
GOGOGO 团队把不同公告的问题找到了一些共性的知识结构,能快速把复杂问题降维。另外,通过章节的识别提升效率。
FDDC 大赛上市公司公告信息抽取赛题第一名 GOGOGO 团队
王政表示,通过这次 FDDC 大赛,信息抽取得到了新的发展,但是以后问题会越来越难、越来越多,会有更多的文本、语音、图像等信息需要处理,期待更多算法专家加入金融行业,推动金融科技发展。