2019 GAITC丨滑铁卢大学教授李明--AI赋能,癌症治疗的关键一步
2019年5月25-26日,由中国人工智能学会主办、南京市麒麟科技创新园管委会与京东云承办的“2019全球人工智能技术大会”在南京紫金山庄召开。本次活动以”交叉、融合、相生、共赢”为主题,汇聚了两院院士等专家学者、众多AI企业家,围绕人工智能理论、技术和应用等展开讨论。
论坛当天,滑铁卢大学教授李明参与了以NLP为主题的圆桌讨论环节,并发表了以"人工智能赋能个体化癌症免疫治疗”为主题的演讲。会后,李明教授就NLP、癌症治疗等相关话题展开了深入交流。李明表示,针对新抗原医疗方法将在癌症个体治疗领域里产生一场革命。
2C难做,2B应用大有“疆土”
“自然语言处理被誉为'人工智能皇冠上的明珠',理解语言是非常难的事情。”李明指出。
事实上,NLP的历史几乎跟计算机和人工智能的历史一样长。自计算机诞生,就开始有了对人工智能的研究,而人工智能领域最早的研究就是机器翻译以及自然语言理解。
过去三年来,深度学习的出现给NLP带来了新的进步。其中在单句翻译、抽取式阅读理解、语法检查等任务上,更是达到了可比拟人类的水平。微软亚洲研究院认为,未来十年是NLP发展的黄金档。
但与人工智能领域中同样热门的计算机视觉技术相比,NLP并没有达到同样的高度,常被人嘲笑缺少实际价值。
拿对话系统举例,针对C端的对话机器人并不受市场买单。其中最根本的一个问题是,目前我们对于语言/文本,在机器能处理的空间中没有一个很好的表达方式,使得现有的对话机器人没有办从语义和逻辑上去理解对话,并且缺乏自学习能力。
李明认为,未来的NLP技术将朝着第二代对话机器人发展,其需要解决理解和学习的问题。基于此,他提出了把以索引为中心的数据结构变成以概念(语义)为中心的数据概念。
“第二代机器人能完成从问题到语义再到回答。要做到这件事,我需要有模版、逻辑,可以做推广,做各种各样的逻辑推理,这样才能达到理解和学习的目的。”
从另一个角度看,NLP的工程化,不是一个个算法的累积,也不是一个个任务的独立优化,而应该是系统工程,综合考虑语言、计算、场景等多种因素,不断演进融合,寻求效果满意解的过程。李明告诉亿欧,虽然做C端的对话机器人难以盈利,但利用NLP技术可以达到赋能B端的目的,其几年前创立的薄言科技所开展的业务正是此类。
作为薄言的董事长,李明向亿欧简要介绍了公司。
薄言源于清华大学滑铁卢大学联合实验室,利用AI为企业提供深度自然语言理解服务。其团队均毕业于清华大学、北京大学和中科院等高校,目前开发了RSVP自然语言智能服务系统,并研制出“薄言超脑”对话平台,以及聊天机器人-薄言豆豆。客户包括华为、京东、小米和有赞等,业务涵盖了教育、医疗、家居等领域。
人工智能赋能个体化癌症免疫治疗
除了深耕NLP领域,李明还在质谱仪肽段测序方面做了19年左右的研究。在研究过程中,李明意外发现了结合深度学习,可以将此类技术应用在癌症治疗中。
目前,应对癌症的治疗方法主要有手术治疗、化学药物治疗、放射治疗、中医药的治疗、靶向治疗、免疫治疗以及一些局部治疗。其中,免疫治疗是一种专门针对癌细胞厮杀的治疗方式。癌症体细胞在突变后可以产生用于区分恶性细胞与正常细胞的新抗原(neoantigens)。然而,如何在个体化层面鉴定这类新抗原和相关验证仍然是一巨大挑战。
现有的癌症免疫治疗流程找到一个病人的新抗原需要3个月时间,并且极不准确,费用极其昂贵。在癌细胞表面找到新抗原,主要需要解决两个问题:一是低浓度,二是变异和PTM。现有的解决方案是采用最新DIA(data independent acquisition)技术,即数据独立采集技术,用de novo sequencing直接解决变异和PTM的问题。但传统的以BSI的PEAKS为代表的de novo 测序办法不适合DIA数据,并且精度不够。
基于深度学习,李明团队设计出了DeepNovo,大幅度改进了精度,并可以使用DIA数据。团队设想的新抗原平台可以通过对患者进行取样,用质谱仪进行分析,通过DIA spectra进行新抗原测序。找到新抗原后制成疫苗再注入患者体内,疫苗会激发患者内的体细胞白细胞等准确攻击杀死癌细胞。
“个体化癌症免疫治疗是颠覆性技术。”李明指出,从专利保护来看,传统制药业中超大药企经过多年开发,花销数十亿美金,申请专利保护一个药,不容易赶超。而在个体化癌症免疫治疗上,每个人的药就是自己特有的新抗原,而专利保护的是找寻新抗原的方法。
李明告诉亿欧,团队近期在北大正在筹办一个癌症免疫治疗中心,也即将在国内成立一个独立的机构或者子公司进行这方面的业务,目前在寻求能深度合作的投资方。如果举全实验室去治疗一位患者,至少需要花3个月,患者需承担的费用在几百万美金左右,希望未来能将治疗成本降至5万-10万美金。
李明:滑铁卢大学终身教授、加拿大皇家科学院院士、ACM/IEEE Fellow;毕业于康奈尔大学。主要研究机器学习,自然语言处理,算法平均复杂度,信息距离和生物信息学。(亿欧丨赖燕芳)