第三期AI未来说·青年学术论坛充满神奇、魅力与挑战的CV专场
2019 年 3 月 24 日下午,“AI 未来说·青年学术论坛”的第三期计算机视觉专场,在北京市中国科学院大学中关村校区 3 号教学楼 S101阶梯教室举行。
计算机视觉(Computer Vision, CV)是人工智能领域中的一个充满神奇、魅力与挑战的子领域,是一门研究如何教机器“看”的科学。这可以理解为研究使用各种成象系统代替视觉器官作为输入,并由计算机代替大脑来完成识别、跟踪、测量、处理的学科。它的最终目标是使计算机能像人一样通过视觉观察和理解世界,具有自主适应环境的能力。随着理论和计算机硬件的发展,计算机视觉技术已经成为了我们日常生活中不可或缺的一部分,像光学字符识别、人脸识别、自动驾驶、增强现实等技术更是屡见不鲜。
本次论坛不仅包括内容丰富的嘉宾报告分享环节,还新增了博士生 panel 环节。报告分享环节共有 5 位嘉宾,包括北京大学的彭宇新教授、清华大学的鲁继文副教授,来自百度公司的李颖超博士、中国科学院自动化研究所的张士峰博士和香港中文大学的李弘扬博士。panel 环节由北京大学何相腾博士主持,共有 5 位嘉宾,除了张士峰博士和李弘扬博士外,还有来自中国科学院自动化研究所朱政博士和李琦助理研究员,以及北京大学的楼燚航博士。
彭宇新教授做“跨媒体智能分析与应用”的报告分享
作为北京大学二级教授、博士生导师、863 项目首席专家、中国人工智能产业创新联盟专家委员会主任委员、中国工程院人工智能2.0 规划专家委员会专家、中国图像图形学学会理事兼副秘书长,彭宇新教授报告的主要内容为跨媒体智能分析与应用的研究背景、AI2.0-跨媒体以及近期的一系列研究进展和应用。并介绍了团队在细粒度图像分类、跨媒体检索、跨媒体数据集和视频描述生成等方面的研究进展和成果转化。
鲁继文副教授做“深度强化学习与视觉内容理解”的报告分享
作为清华大学自动化系副教授、博士生导师、国际期刊PatternRecognition Letters主编,鲁继文副教授报告的内容主要包括视觉内容理解的概述、所面临的主要挑战、深度强化学习方法在内容理解领域的应用和改进以及相关的总结。并介绍了强化学习的模型与应用,使用马尔科夫决策过程对视频进行建模的方法,并利用深度强化学习来选取视频的有用帧。深度强化学习同时利用深度学习的表示能力和强化学习的决策能力,对许多视觉内容理解任务有更好的建模策略,可有效提升相应视觉任务的性能。
李颖超博士做“百度增强现实技术进展与应用”的报告分享
作为百度增强现实技术部高级经理,李颖超博士报告的内容主要包括百度AR 技术的原理与实际应用展示。通过结合百度大脑和百度计算机视觉的整体技术布局,介绍了百度AR的技术原理、进展和应用。AR 技术的三要素包括现实世界、虚拟信息和人。核心技术包括感知跟踪(2D物体、3D物体、SLAM/VO/VIO和语义分割)、虚实融合、人机互动、内容生产。并向我们展示了多种百度增强现实的相关产品。
张士峰博士做“基于深度学习的通用物体检测算法对比探索”的报告分享
中国科学院自动化研究所张士峰博士报告的主要内容包括物体检测的介绍、一二步法的对比探索和检测发展的讨论展望。物体检测可以简单定义为 What(类别)和 Where(位置)的问题。介绍了物体检测的一步法和二步法,并对比了一二步法的优势与不足,并由此介绍了RefineDet。最后总结了物体检测的未来发展趋势。
李弘扬博士做 “物体检测最新进展”的报告分享
香港中文大学多媒体实验室博士生、微软亚洲研究院实习生李弘扬博士报告的主要内容包括物体检测的介绍、Feature Intertwiner Module 和物体检测的未来发展趋势。讲解了为什么有固定的 ROI 输出,为什么要把小的 anchors 放在网络的前端,而把大的 anchors 放在网络的后端。并介绍了二步法存在的一些问题,以及 FeatureInterwiner modeule,其核心思想是使用大的目标来指导小目标的学习。最后对物体检测的未来进行了展望。
博士生 panel 环节
博士生 panel 环节主要围绕物体检测与跟踪之间的联系,GAN 为什么会火,以及如何高效地发论文等问题展开了讨论。
“AI未来说·青年学术论坛”系列讲座以贯彻落实国家人工智能发展规划和推动我国人工智能技术水平进步为目标,通过业界专家、青年学者和优秀学生介绍领域前沿技术成果和分享教学、科研和产业化经验,促进产、学、研结合,助力我国人工智能行业的蓬勃发展。