百度飞桨亮相软件绿色联盟开发者大会 两项最新成果直指产业落地
11月19日,由阿里巴巴、百度、华为、腾讯、网易等国内知名企业策划发起,2019软件绿色联盟开发者大会于北京国家会议中心正式开幕。百度深度学习技术平台部总监马艳军,与在场的300+合作伙伴及2000余名开发者分享了开源深度学习平台飞桨面向大规模产业应用的最新技术进展。
深度学习技术的发展和突破,使得人工智能切实成为驱动各行各业智能化升级的核心力量。而上承应用,下接芯片的深度学习框架可谓这个智能时代的“操作系统”。基于开源开放的深度学习平台进行开发,能够有效降低深度学习技术应用门槛,让开发者和企业避免重复“造轮子”,这也是当前业界主流的开发方式。
飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,2016年正式开源,是中国首个也是目前国内唯一全面开源开放、技术领先、功能完备的产业级深度学习平台,且拥有完整的自主知识产权。活动现场,倪光南院士在题为《自主创新 迎接软硬件生态新潮流》的演讲中也呼吁道,应加快推进中国网信技术自主可控,并指出一条开源软件促进软件业开放创新之路。
当前, AI+5G+IOT的快速发展正开启着全场景的智联生活,各行各业正在应用人工智能技术进行智能化升级,共建自主可控的泛终端软硬件生态成重要议题。面对大规模产业应用的挑战,现场马艳军着重分享了端侧推理引擎Paddle Lite 2.0以及四大产业级端到端开发套件两项飞桨的最新成果。
针对泛移动端,软件层面如搜索排序、视频推荐等应用超大规模稀性特征、万亿级模型参数在线持续学习、终生学习的挑战,以及硬件层面异构计算等挑战等,百度飞桨推出了轻量级的端侧推理引擎Paddle Lite 2.0。
据介绍,Paddle Lite 2.0版本拥有三大特点,包括:高易用性,提供大量的示例代码,以及操作的指南,方便快速实现在不同的设备场景上进行部署;广泛的硬件支持,Paddle Lite目前已经支持了8种主流的硬件,同时支持华为NPU和边缘设备的FPGA,且设计架构非常便于新硬件的拓展;以及性能优势,Paddle Lite性能优势不仅在FP32场景下,尤其是在移动端已广泛普及的INT8上领先优势会更加明显。性能优势对于实际的应用是至关重要的,时延上的优势直接关系到最终开发产品的用户体验。
值得一提的是,Paddle Lite与华为HiAI Foundation进行了深度联合优化取得了很好的进展。大会当天下午,华为正式对外发布了HiAI3.0版本。发布会上,百度深度学习技术平台部技术经理高铁柱,介绍了百度Paddle Lite端侧推理框特性及与华为进行的深度适配。双方在新一代人工智能产业技术创新战略联盟启动端测AI软件标准研究工作,通过标准化推理接口与标准化应用接口,促进端侧AI产业规模化有序发展,更好地助力开发者使用端侧AI进行应用创新。
除互联网领域外,当前深度学习也大量在传统行业中落地。针对落地过程中,问题定义技术选型、验证成本高研发周期长、设备成本限制及特定性能要求等真实挑战,飞桨推出了4大面向应用任务的产业级开发套件,包括:ERNIE语义理解,PaddleDetection目标检测、PaddleSeg图像分割,以及推荐方向的ElasticCTR点击率预估,降低开发门槛,满足低成本和快速集成需求。
语义理解方面,ERNIE开发套件是基于持续学习语义理解框架ERNIE 2.0升级而来,在16个中英文任务全面超越对标产品,具备轻量方案、能力全面、极速预测、部署灵活、平台赋能等五大特色。
PaddleSeg产业级图像分割库,覆盖了DeepLabv3+、PSPNet、U-Net、ICNet四大主流的分割 模型。通过统一的配置,帮助用户更便捷地完成从训练到部署的全流程图像分割应用。
目标检测方面,PaddleDetection,已集成60+预训练模型并包含百度国际竞赛冠军模型。目的是为工业界和学术界提供易使用的目标检测模型。在这个库中,飞桨还提供了许多目标检测小模型,方便移动端设备使用。
用于个性化推荐的ELASTIC CTR,源自于百度的产业实践。可以实现分布式训练CTR预估任务和Serving流程一键部署,提供了端到端的CTR训练和二次开发的解决方案。