TIC 2018热议人工智能 AI进入应用落地期
5月15日,由国内领先的中立云服务商UCloud主办的Think in Cloud 2018在北京富力万丽酒店隆重举行。Think in Cloud(以下简称“TIC”)已连续举办四届,是中国云计算行业的顶级盛会。除UCloud高层和技术专家外,还邀请了众多互联网及传统领域创新公司的CEO、CTO、行业和技术专家以及诸多云生态体系中的合作伙伴到场分享,传达最前沿的技术热点与行业洞察,吸引了云计算、大数据、人工智能、区块链、物联网等诸多行业领域的投资、管理、技术、运维等五千人余人参会。
TIC 2018人工智能的应用实践专场
近两年,人工智能产业迅速兴起,AI技术逐渐被运用于各行各业。无论是初涉人工智能应用的传统互联网企业,抑或是人工智能领域的创业公司,如何快速、高效地落地AI应用都是巨大的挑战。在5月15日下午的人工智能的应用实践专场上,来自UCloud、驭势科技、第四范式、褚时科技的专家,以及企业人士、媒体记者齐聚一堂,聚焦人工智能的实际应用与实践,探讨如何利用云计算技术助推机器学习、深度学习、视觉计算等AI技术和应用迅速落地。
公有云助力AI应用快速落地
究竟什么场景需要AI赋能?如何快速、低投入地验证AI技术?如何快速展开AI应用业务?如何高效实现AI应用迭代?UCloud AI平台技术专家宋翔在开场演讲中为在场观众一一解答。接触AI的人都知道,AI有大量的框架、各种各样的技术算法和实现方式,实施过程中会用到各种底层的资源,从AI技术验证、开展AI应用业务,到AI应用迭代整个过程将会遇到各种各样的问题。
UCloud AI平台技术专家 宋翔
宋翔总结AI的挑战来自三大方面:一是基础环境,在AI入门阶段基础环境是非常大的挑战,涉及AI框架、算法库、GPU技术库、存储等各种设备,各类交叉选择之后的环境更加复杂,如何选择适合自己的研发环境是一大挑战;二是AI系统建设,这个过程中需要考虑算法兼容性、平台扩展性、分布式化、纵向扩展、高可用以及容灾能力等问题;三是投入产出问题,如何用较少的投入得到较高的回报?如何通过调研精确需求,控制研发成本,如何降低资源成本和运营成本,让研发人员更关注算法,都是AI所面临的挑战。
如何应对这些挑战呢?UCloud认为解决这些问题的核心方法就是实现平台化,包括环境分离、分布式化、可扩展性和资源共享四个方面。环境分离方面有两个主要方向,一是通过容器的封装把软件和运行环境隔离,把存储和计算隔离,让更多的存储资源可以接入到AI环境中去;二是数据分离,因为对AI来说,训练过程中的数据非常重要,只需要提供本地存储的接口即可访问各种数据层,实现良好的数据访问。
AI训练平台
同时,平台化能做到良好的资源共享,例如通过UCloud的AI训练平台和在线服务平台,用户想做AI训练,只需要把任务提交到训练平台,就可以在平台上自动的完成任务,而无需要关心这个任务是否失败、到底在哪台机器上跑等一系列问题,可以大大简化AI算法人员使用平台的复杂度;对于算法人员或业务人员来说,有了在线服务平台,当他实现算法之后,可以用这个平台快速地部署自己分布式的在线任务,而无需自己搭建一个分布式的环境或服务。
AI在线推理平台
宋翔提到,有了这些平台和技术,研发人员在做横向扩展和纵向扩展时变得更加简单,分布式平台在资源使用率提高的同时,也不需要太多的成本去管理这些资源。最后,宋翔还列举了三个UAI-Inference以及UAI-Train在互联网社交、广告及AI培训领域的典型案例,分享UCloud在人工智能技术领域的实践经验。
嵌入式设备上的实时深度学习方法实践
驭势科技人工智能技术负责人潘争分享了驭势科技在嵌入式设备上的实时深度学习方法实践,以及UCloud GPU服务器在自动驾驶领域的应用情况。视觉感知具有信息更丰富、视野更宽阔、基建更配合、硬件更便宜几大特点。潘争介绍到,从2010年开始,每年一届的ImageNet计算机视觉挑战赛通过不停的调优深度学习网络,2017年已经将识别的错误率降到2.5%以下,可见视觉识别的进步之大。
驭势科技人工智能技术负责人 潘争
视觉感知在做模版时可以不计成本,但是当技术落地成为产品时却需要进行诸多考量,如在自动驾驶领域要做到低成本、低功耗、合车规、实时性以及精度让用户满意等等。其中,合车规是自动驾驶领域的特别需求,汽车的寿命有十余年,汽车里的所有硬件都需要满足安全标准,电子器件从零下四十度到零上七八十度都要正常运行,车规级的要求十分严苛。
PVANet+fasterRCNN物体检测
驭势科技希望用嵌入式的GPU平台去完成视觉感知所需要的计算,达到像激光雷达一样甚至更低的成本。要做到这一点,就需要做诸多的网络压缩优化工作,同时在嵌入式的GPU上做运算,精度也要足够高,这就引出了在效率和精度之间如何取舍,达到一个比较平衡的网络选择的话题。潘争介绍,以人车检测性能为例,完成这样的检测任务已经不再需要成百上千层的网络,在相对密集的场景中,驭势科技可以把所有的人、车检测出来,更好的辅助自动驾驶。最后,潘争还向参会嘉宾分享了嵌入式GPU+CPU加速以及低成本车规级的FPGA加速技术在自动驾驶领域的应用情况,得到了与会嘉宾的一致好评。
基于云计算构建机器学习系统
UCloud实验室负责人兼高级研发总监叶理灯在会上介绍了云计算的发展历程,Serverless产品及架构,如何构建机器学习在线推测系统,以及其在头像识别、OCR和AI应用市场领域的实际应用案例。他提到,Serverless具有免运维,可弹性扩展,高可用,按需付费等特点,对开发者来说,构建一个APP无需考虑架构,直接用Serverless即可,这是一项巨大的进步。
UCloud 实验室负责人兼高级研发总监 叶理灯
叶理灯表示,构建AI机器学习系统需要进行Build、Train和Inference三个步骤。选定算法及参数,进行训练之后的模型变成在线服务就是Inference的过程。在线推测系统包含底层计算平台,APP Engine层,以及通过SDK进行数据流的控制。
在线分类系统
UCloud的UAI-Inference提供海量计算节点,自动负载均衡,动态扩缩容,适用于图像识别、自然语言处理等多个AI领域。叶理灯分享了来自社交用户的头像识别案例,可自动识别用户是否上传头像、头像是人还是风景,从而根据不同信息推荐不同的内容。
头像识别
用户自己搭建这样的系统会有很多负担,既要考虑高可用,也不知道具体需要申请多少虚拟机来完成这个任务。有了在线推测系统,只需要将每次训练的模型推给UCloud,用户就可以很快地构建自己的系统,而且无需运维。此外,叶理灯还还介绍了UAI-Inference在OCR、AI应用市场等实际应用场景的落地情况,让参会听众受益颇多。
AI技术在客服领域的应用实践
第四范式智能客服负责人、资深数据科学家刑少敏分享了《AI技术在客服领域的应用实践》。第四范式是国际领先的人工智能技术与服务提供商,由其开创的“迁移学习”被业界认为是“下一代的人工智能技术”。 当前,随着社会经济的发展,客服的成本逐渐提高,人工客服无法24小时在线,为智能客服提供了广阔的市场。
第四范式智能客服负责人、资深数据科学家 刑少敏
智能客服的常见功能包括单轮问答、多轮对话和人机协作三类。实际上,智能客服只用来解决高频简单的问题,疑难问题则是交给人工客服完成,因此大部分场景下仍然需要人机协作,也就是机器人+人工进行回答的模式,只有少部分由机器人直接推荐答案。
智能客服技术难点
智能客服有其基本的工作流程,需要将问题进行自然语言处理,经过意图识别,以及自定义的知识库和知识图谱,当用户问题提交时,通过模板或机器翻译,转换成知识图谱查询语言,从知识图谱工具里查出结果,进行档案的包装,返回给用户,就是一个完整的问答过程。这是以人为主,机器为辅的方式。
第四范式智能客服
第四范式的智能客服能够实现以机器人为主,以人为辅,也就是无缝的人机协作。在前期,人话占问答的一大部分,人工回答以后,机器进行学习,随着机器学习的知识越来越多,知识库越来越丰富,机器能回答的会话也将成倍数增长,大大节约了用户的客服成本。
AI技术在教育领域的应用
“近两年培训机构有一些来自家长的需求,他们希望有一个能够陪小孩对弈的系统,且系统的难度可控,AI技术如何在教育领域应用,其实需要一些小技巧。” 北京褚时科技CEO李曙光提到。在自动口语评测领域,基于GOP的评测技术,例如英语流利说,是通过语音模型分数对比发现有问题的读音,这项技术主要用于跟读环节。还有Freetalk口语评测技术,类似托福、雅思的开放式题目,可以运用这项技术进行口语考试的自动打分和批改,分析用户的发言、语音语调、语法和流利度等等。目前机器在打分上已经可以取代人工,大幅地降低了教师的重复劳动。
北京褚时科技CEO 李曙光
人工智能对于培训机构而言,不单单是节省成本的问题,由于大部分学生缺乏练习环节,因此AI技术还能帮助学生提高学习成绩。自动作文评测技术让老师更愿意为学生布置作文作业,学生通过这项技术,一篇作文可以不断练习40至50次,不仅降低了老师的工作强度,也提高了学生的学习成绩,一举两得。自动作文评测基于海量的人工批改数据研发,实现了语法错误检查、自然语言处理分析特征提取以及自动打分引擎,打分纬度除了语法,还有用词、文章脉络、句子之间连贯程度等更加复杂的方面。
手写识别