抢票 | AI未来说学术论坛第四期 语音技术专场
AI已来,而你来不来!?
人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说”青年学术论坛第四期如约而至。来自清华、中科院、百度、小米的各位专家和青年才俊,共同阐述计算机视觉领域的最新研究成果。一场专注于青年学者和大学生的AI论坛等你报名,可以快速定位文末报名哦~
由中国科学院大学主办,中国科学院大学学生会承办,百度公司提供支持,读芯术作为指定合作自媒体的“AI未来说·青年学术论坛”第四期将于2019年4月27日下午13:00-17:00在中国科学院大学(中关村校区)中关村南一条3号教学楼第一层S101举行。
活动信息
报名时间:即日起至4月26日晚24:00。
活动时间:2019年4月27日13:00 - 17:30。
活动地点:中国科学院大学(中关村校区)中关村南一条3号教学楼第一层S101。
嘉宾及分享内容
陶建华《语音技术现状与未来》陶建华,中国科学院自动化研究所所长助理、研究员、博士生导师,模式识别国家重点实验室副主任、中国科学院大学首席教授和人工智能学院院长助理,国家杰出青年基金获得者,国家万人计划领军人才,享受国务院政府特殊津贴。主要从事智能交互、大数据分析、模式识别等方向,在国内外主要期刊或会议上发表论文300余篇,研究成果多次在国内外学术会议上获奖。先后负责国家863重点项目、国家重点研发计划项目、国家自然科学基金重点项目、中科院先导项目、国家发改委项目等重点科研任务。目前担任中国计算机学会会士和常务理事、中国人工智能学会理事兼智能交互专委副主任、中国图象图形学会理事兼人机交互专委主任、中国中文信息学会理事兼语音信息专委副主任等,并担任Speech Communication、JMUI等多个主要国内外期刊编委,同时担任Interspeech、ACII、IEEEICSP、IEEE MLSP、ISCSLP、NCMMSC等会议大会主席或程序委员会主席。
报告内容:通过语音技术的发展历史,分析现有语音技术的主要技术特点,以及语音技术在应用中的主要几种形态和面临的问题。报告还将进一步分析语音技术面临的挑战性的问题,以及未来的技术发展思路。
吴及《音频信号的深度学习处理方法》清华大学电子工程系副系主任,长聘教授,博士生导师。1996年和2001年在清华大学电子工程系获得工学学士和博士学位,2013年至2015年在美国佐治亚理工学院担任访问学者。主要从事人工智能,机器学习,自然语言处理,模式识别,数据挖掘等领域的研究工作。从2006起担任清华-讯飞联合实验室主任。现在为IEEE高级会员,中国语音产业联盟技术工作组组长,认知智能国家重点实验室学术委员会委员,口腔数字化医疗技术和材料国家工程实验室第二届技术委员会委员,中国计算机学会语音对话与听觉专业组委员。还担任2018-2022教育部电信类专业教学指导委员会副秘书长,承担国家重点研发计划,863,国家自然科学基金,工信部电子发展基金等多项国家科研项目。参加的项目“智能语音交互关键技术及应用开发平台”于2011年获国家科技进步二等奖。负责的项目“面向海量语音数据的识别、检索和内容分析技术及其应用”获2014年度北京市科学技术奖一等奖。已在Nature Communications,IEEE Trans. on ASLP,AAAI,ACL等重要学术期刊和学术会议上发表论文近一百二十篇。
报告内容:深度学习方法的引入显著推动了语音技术的进步。语音识别,语音合成和说话人识别的实际应用都在不断增长,语音技术已经成为人工智能的重要组成部分和应用落地的主要方向之一。音频信号要比语音信号范围更大,也有很多重要而有趣的研究方向,比如音频场景分析。对于音频信号,传统上的处理方法都可以分为音频特征抽取和音频序列建模两个主要部分。在这个报告中我们讨论了将深度学习方法引入音频信号处理中的一些尝试和初步结果。
王育军《小爱背后的小米语音技术》小米人工智能部门人工智能实验室语音技术总监。2000年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002至2004年年就职于NEC电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007年到2012年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015年就职于乐视,负责语音识别与自然语言理解技术。2017年加入小米,负责语音识别与语音合成技术。
报告内容:语音技术,包括语音识别与合成等,经历了几十年的发展,随着算力,数据,开源,人才的爆发,结合用户场景的重新定义,而再次活跃于用户的视野。小米的语音快速的借助“弯道”达到了80分的成绩,但也无法避免进入到了语音锅碗瓢盆的“平凡生活”,我们必须要面对失配和不当的模型假设。在这些方面我们和前辈的时间差距,就是2017减前辈团队成立的时间。我们体会到“热”启动项目带来的浮华,也被那些“冷”启动项目深深的伤害着。但我们不能无脑地、不停地接着大大小小的项目,因为那样连僵尸都不会喜欢。我们要创新,产品创新和技术创新是寒冬里的强心剂。本次我们将分享小爱背后的语音技术之路,以及路上的风景和经验。
康永国《AI时代的百度语音技术》百度主任架构师,CCF语音对话与听觉专业组常委。2006年博士毕业于中科院自动化研究所,2013年加入百度,负责组建语音合成团队及语音合成技术开发。在两年的时间内先后开发上线了基于拼接的在线合成和基于统计的离线合成,合成效果超越竞品科大讯飞,分别应用在了手百、地图等数十条产品线,曾经带领团队荣获TG体系2015年最佳进攻团队。2016年,在推进产品落地的同时大力推进合成团队技术创新,将深度学习技术和语音合成中的声学建模、韵律建模以及文本处理结合在一起,并将其应用在了大数据情感合成中,大幅提升了大数据情感合成的合成效果,带领团队获得2016年百度最高奖。在技术攻坚之外还提倡有温度的技术,将语音合成技术应用在了怀念张国荣活动和北京电视台时光缘节目的原音重现中,在使用技术传递正能量的同时大大提升了百度的品牌形象。
报告内容:在深度学习为主流的AI时代语音技术获得了突破性的进展,而百度作为最早进行语音技术研发的互联网企业,其语音技术一直处于业界的领先地位。百度语音技术部是百度内部唯一进行语音技术研发的部门,为百度搜索、地图、度秘、百度云等产品部门提供语音识别、合成、唤醒等语音技术,并且通过百度语音开放平台服务于万千开发者。本次报告将介绍百度语音技术部最近在各项语音技术上的最新进展,揭秘小度音箱背后的黑科技。
刘斌《基于联合对抗增强训练的鲁棒性端到端语音识别》刘斌,中科院自动化研究所模式识别国家重点实验室博士生,导师是刘文举研究员。主要研究兴趣为鲁棒性语音识别、声纹识别、语音唤醒、对抗学习。把对抗学习应用到鲁棒性语音识别中,获得ICASSP2018最佳学生论文奖,先后参与华为、腾讯、滴滴、学而思等合作项目。
报告内容:近年来,端到端系统在语音识别领域取得了重大突破。然而,端到端的结构对于噪声和混响的干扰不是特别鲁棒,在现实应用中性能显著降低。为了减轻这个问题,主流的方法是使用语音增强作为语音系统的前端模块。然而,增强模块会导致语音失真,与训练不匹配,有时会降低识别性能。在本文中,我们提出了联合对抗增强训练用来提高端到端系统的鲁棒性。具体地,我们使用基于掩蔽的增强网络、基于注意力的识别网络以及判别网络的联合训练方案。判别网络用于区分增强语音特征和纯净语音特征,可以指导增强网络输出更加接近真实分布。对于训练中的识别、增强和对抗性损失进行联合优化,使得语音识别系统的鲁棒性更强。AISELL-1的系统实验表明提出的方案提高了端到端系统的鲁棒性,相对于多条件训练相对误差率降低4.6%。
如何报名
报名方式报名链接:
http://zybdv.xiuzan001.cn/fankui/XNW5BOALy7g6.html?randomStamp=675828
注意事项1. 由于本次活动的名额有限,请认真填写报名的信息,方便工作人员审核。
2. 报名系统将会开放至2019年04月26日晚24:00。
3. 报名时请注意,报名信息填写完成后,点击提交会进入到报名成功的界面。记得添加“AI未来说·青年学术论坛”小助手获取门票,加入社群呦,更有神秘礼品随机掉落,业界大牛为你答疑解惑。