第六期“AI未来说·青年学术论坛”带你进击机器学习
2019年6 月 23 日下午,“AI 未来说·青年学术论坛”第六期机器学习专场,在中国科学院大学中关村校区3号教学楼S201阶梯教室举行。
“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。
机器学习是人工智能的一个分支,也是人工智能的一种实现方法。它使机器能够自动学习并从经验中不断地对自身进行改进,从某种意义上说,是让机器通过获得思考能力来解决问题的方法。机器学习从样本数据中学习得到知识和规律,然后用于实际的推断和决策,是一种数据驱动的方法,它包括多种问题的定义,提供多种不同的算法,因此,能解决不同领域的各种问题。目前,机器学习已广泛应用于各个行业,如图像识别、语音识别、搜索引擎、商品推荐、医疗诊断、无人驾驶以及自然语言处理等。
本次论坛共邀请到5位嘉宾,包括中国科学院自动化研究所张文生研究员、中国科学院计算机技术研究所庄福振副研究员、百度深度学习技术平台部主任架构师胡晓光老师、清华大学王奕森博士和南京大学赵申宜博士。
张文生研究员作“健康医疗大数据时代的认知计算”的报告分享
作为中国科学院自动化研究所研究员、博士生导师、中国科学院大学人工智能首席教授、中科麦迪人工智能创新研究院院长,国家“云计算和大数据”重点专项总体组专家,中国人工智能学会智能服务专委会副主任,张文生老师报告的主要内容包括医生诊断的数学模型、数学模型不可计算性、认知计算与智能医生、大数据融入智能医生和认识计算的现在与未来五个部分。
报告首先以医生诊疗过程引入,介绍了疾病诊断问题的数学模型,并从疾病诊断是非确定性问题、精准计算难以实现的问题出发,给出了医疗大数据分析的未来几个要点。然后介绍了认知计算模型结构及原理、认知计算与智能医生模型,进而讲到了健康诊疗行业的聚焦与布局,并详细讲解了IBM的人工智能问答系统Watson和医疗专家系统MYCIN的案例。接着,分析了Watson的成败,并从大数据提升医疗智能的角度讲到了未来治疗生态,并介绍了融合语义交互的智能问医生的语义分析架构和智能问医生线上APP应用,以及他们团队所作的糖尿病视网膜病变辅助诊断的工作。最后,展示了自己在医疗大数据应用落地方面所做的工作。
庄福振副研究员作“基于知识共享的机器学习算法研究及应用”的报告分享
作为中国科学院计算技术研究所副研究员、硕士生导师、中国人工智能学会机器学习专委会委员、中国计算机学会模式识别与人工智能专委会委员,庄福振老师报告的主要内容包括基于知识共享模型的基本概念介绍、团队在基于知识共享的机器学习和数据挖掘算法方面所做的研究工作及其未来方向三个部分。
报告首先介绍了大数据及应用场景,并以大数据分类为例讲到了数据标注这一应用难点,引出了基于知识共享的四种模型(迁移学习、多任务学习、多视图学习和模型融合),进而探讨了这些模型之间的区别与联系。然后,分别对迁移学习、多任务学习、多视图学习的概念及其应用场景进行了详细的介绍。最后,从理论分析、应用、有向/无向、粗粒度/细粒度和隐私等角度探讨了基于知识共享的机器学习算法研究的未来方向。
胡晓光老师作“飞桨(PaddlePaddle)核心技术与应用实践”的报告分享
作为百度深度学习技术平台部主任架构师,胡晓光老师报告的主要内容包括飞桨总体介绍、飞桨核心框架、飞桨新特性和飞桨模型应用四个部分。
报告首先以深度学习技术在各行业的广泛应用及其在企业应用的流程作为引入,进而介绍了飞桨的演进以及飞桨的全景概览。接着,从飞桨对建模、训练、服务的三大AI场景的支持出发,介绍了飞桨的核心框架,包括组网模块、模型训练、模型表达与优化和PaddleServing,并重点介绍了Python API、计算过程、用户和框架的分工、架构图等核心技术。然后,从飞桨的服务部署能力、模型压缩能力和全功能分布式训练能力等方面介绍了飞桨的新特性。最后,展示了飞桨全面的官方支持模型库,并详细介绍了用于智能视觉的PaddleCV、人脸检测算法PyramidBox、视频分类库、用于智能文本处理的PaddleNLP、语义表示模型ERNIE、机器翻译模型Transformer,同时展示了AI识虫、精密零件智能分拣两个应用案例。最后,给出了飞桨的使用的详细的资料。
王奕森博士作“AdversarialMachine Learning: Attack and Def
作为清华大学计算机科学与技术系博士毕业生,美国乔治亚理工大学和澳大利亚墨尔本大学访问学者,百度奖学金获得者,王奕森博士报告的主要内容包括:对抗机器学习研究意义、对抗学习的攻击(Attack)和防御(Defence)介绍、对抗训练中的收敛质量的指标FOSC(First-OrderStationary Condition)和动态对抗训练算法以及总结四个部分。
报告首先以机器学习顶会中的best paper作为引入,展示了学术界对对抗机器学习的关注,并以视觉问答系统、自动驾驶和相关的自动监控的视频生动形象地介绍了机器学习中对抗的例子,并延伸至物理世界真实存在的相关例子。接着,从攻、防两方面介绍了对抗学习:在攻击方面,分别以黑盒攻击和白盒攻击两种类型探讨了如何生成对抗实例来攻击深度模型;在防守方面,从检测和对抗训练两个角度探讨了如何提高深度模型对对抗实例的鲁棒性。然后,重点介绍了对抗训练概念及其核心思想,并从对抗训练收敛性的角度,提出了FOSC的概念及其封闭解形式,以及对抗强度、对抗训练过程的FOSC描述(详情参看ICML2019Long Oral 论文,Yisen Wang et.al, “On the Convergence and Robustness ofAdversarial Training”)。
同时,提出了动态对抗训练的方法,并对其收敛性和鲁棒性进行了分析,并给出其FOSC描述。最后,对对抗机器学习研究进行了总结和展望。
赵申宜博士作“SCOPE:Scalable Composite Optimization for L
作为南京大学计算机科学与技术学院博士研究生,百度奖学金获得者,赵申宜博士报告的主要内容包括:机器学习简介、可扩展的组合优化学习(SCOPE)、非凸模型和总结四个部分。报告首先以机器学习的一些基本概念,包括模型、优化函数、随机梯度优化算法(SGD)、分布式部署等引入,分析了目前常用的训练算法,如同步SGD等,在分布式训练过程中通信开销大的缺点,由此提出了新的分布式SGD,即可扩展的组合优化学习(SCOPE)的概念。
接着,对SCOPE的框架、算法实现流程、局部目标函数、数据分割评价、收敛性等进行了介绍,并展示了算法在逻辑回归、Lasso中的实验结果。然后,研究了同步SGD针对非凸模型的优化—GMC算法,并给出了实际数据集的实验证明。最后,给出了凸模型应使用SCOPE,非凸模型应使用GMC的结论。
“AI未来说·青年学术论坛”系列讲座以贯彻落实国家人工智能发展规划和推动我国人工智能技术水平进步为目标,通过邀请业界专家、青年学者和优秀学生介绍领域前沿技术成果和分享教学、科研和产业化经验,促进产、学、研结合,助力我国人工智能行业的蓬勃发展。
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”