微软核心业务即将上线ProjectCortex:AI知识图谱大幅提企业效率
机器之心原创
作者:Yuan Yuan
微软正为旗下核心服务 Microsoft 365 引入知识图谱功能:通过 AI 算法对数据的整合,很快我们就可以在日常工作中享受人工智能技术带来的各种便利了。
「知识」正在成为企业等组织中无法被忽视的重要资源。因此,对知识的积累、管理和精准调用也逐渐被视为成为提高企业竞争力的重要手段。
微软 CEO 萨蒂亚·纳德拉(Satya Nadella)在 2019 年 Microsoft Ignite 大会的主题演讲中宣布,知识领域将成为 Microsoft 365 下一步的发展重点。Microsoft 365 作为微软提供的完整智能解决方案,包括了 Office 365,Windows 10 和 Enterprise Mobility + Security,致力于帮助组织里所有成员发挥创造力,并提高协同合作的效率和安全性。「知识」正在成为 M365 除传统的「协作」、「工作流」、「安全管理」之外的第四大支柱。
在美国佛罗里达州奥兰多举行的 2019 年 Microsoft Ignite 会议上,微软「Microsoft 365」的副总裁杰瑞德·斯派塔罗(Jared Spataro)介绍了 M365 的最新成果—被称为 Project Cortex(大脑皮层项目)的知识网络,这是 M365 自 2017 年推出 Teams 之后首次推出新的商业服务。Project Cortex 也标志着「知识」领域正式成为 M365 最新关注和投入的重点。
Project Cortex 旨在借助 AI 构建的知识网络,对组织内的数据进行推理,并自动按照项目或者客户等相关性,将数据梳理成为成共享话题。它还能以这些共享话题为依托,将相关的知识发送给组织内部的相关人员。
除此之外,借助智能内容摄取技术的创新,这个项目还能将组织里的内容转化成交互式的知识库,并通过分析文档和用户的反馈信息创造出更复杂的内容模型。
作为组织的「大脑」,具备不断学习更新的能力至关重要。Project Cortex 将允许与任意主题相关的专家对系统进行指导,以帮助其理解半结构化的内容。同时,它的知识提取功能也能够帮助人们更容易地获取到现有的,但被淹没在万千文档、对话、会议、视频等资料中的,有价值的知识。
Project Cortex 用 AI 生成的知识网络能够将有关某一主题或内容(例如演示、视频和对话)的概念解释、关联信息、相关专家等等都集成到一张类似维基百科的知识话题卡片中,分享给组织内的成员,这将大大增加整个公司或组织在相关员工中共享知识和经验的效率。
十年磨一剑:依托自身丰富的产品线 借助图谱技术构建知识网络
斯派塔罗告诉机器之心,Project Cortex 起源于十年前,但当时技术方面的不成熟限制了他们实现创建理想的「大脑」的能力。如果说十年前的「大脑」仅仅停留在搜索和标注之类的功能上,随着人工智能技术的发展,今天的「大脑」终于能够应对足够丰富的场景,从而使产品化成为可能。
他指出,Project Cortex 的核心,也是最关键的技术突破在于图谱(graph)。简单来说,通过把用户和信息作为节点,连接这些节点并判断潜在关联,再利用 AI 将节点之间的关系全部梳理清楚,最终形成一个完整的组织图谱。
Project Cortex 项目的研发团队负责人为 Office 365 的副总裁杰夫·特珀(Jeff Teper)。特珀曾经负责 SharePoint 的产品设计和研发,现在则同时兼任 Office apps,OneDrive 和 SharePoint 的研发领队。
SharePoint 是与 Microsoft Office 集成的基于网络的协作平台,OneDrive 提供文件托管和同步服务,而 Office app 则包括了多个内容创作平台的软件—把这三者结合起来,为 Project Cortex 的落地创造了良好的条件。且 SharePoint 等平台现有的安全性、合规性和工作流也能帮助 Project Cortex 简化流程、提高效率。
M365 的产品经理塞斯·巴顿(Seth Patton)表示,在部署知识网络的时候,微软主要考虑了四个维度,分别是「收集和管理知识」、「识别、理解和归纳知识」、「应用已获得的知识」和「将知识转化为加速学习和分享的过程」。
他在本周二上午的媒体展示会上分享了 Project Cortex 的五个要点—包括激励用户在日常使用的微软 app 上创建和分享知识,利用 AI 为用户自动标注和整理出知识图谱,创建话题卡片、页面和知识中心,在 SharePoint 平台的基础上加入外来内容和注释,以及在安全性、合规性和工作流的加持下管理内容和知识。
万事俱备只欠东风:精准挖掘 快速分享
斯派塔罗在谈及 Project Cortex 对 M365 的战略意义时表示:「到目前为止,M365 主要的价值是提高流程效率。知识这一块(的投入),尤其是 Project Cortex 就像打开了新世界的大门。我们认为能够应对复杂多变的新情况的知识很多时候都已经在组织里了,但是很难很难能把他们挖出来—Project Cortex 等于是把最重要、最有价值的知识挖出来的工具,然后分享到另一个部门、国家、市场等等。」
微软 M365 的协作与知识总监丹·霍姆(Dan Holme)说:「Project Cortex 主要应用 AI 做了三件事—收集、管理和传递知识。」其中的收集不仅包括了 Microsoft 365 平台里的所有内容—文件、对话、视频、会议等,还包括相关联的外部系统带来的信息。组织则是从海量数据库中提取元数据来帮助理解内容,然后使用 AI 的挖掘技术来学习所有相关的知识,最终创建出知识图谱或知识网络。当 AI 将所需的知识汇集在一起,就可以将其纳入用户的日常使用体验中,并成为一个良性循环。
霍姆说道:「尽管 AI 代替以往知识和内容管理中需要人为承担的大部分工作,但人类的专业知识—相关专家对知识网络的调整、补充和完善,会使 AI 逐渐变得更加智能。」
霍姆演示了 Project Cortex 的应用场景。例如,当用户在一封电子邮件中遇到不确定的项目词汇时,Project Cortex 将自动生成并显示以该词汇为主题的「知识网络」。用户只需将鼠标悬停在陌生的词汇上,就能看到自动弹出的「主题卡片」。这个主题可以是某个项目、客户、流程或者策略,任何对团队或组织而言重要的内容,都可以通过 AI 识别、汇总、整理并与整个组织的信息和专业知识联系起来。
「主题卡片」类似一个由 AI 生成的维基百科页面,但它是非公开的、为组织或企业私有的资源。假如你需要了解一个项目,主题页面会包括项目介绍的摘要,并自动标注来源—告诉你 AI 是从哪个过往文件中找到它的,谁是该文件的贡献者等等。继续往下拉就能看到项目细节、重点、专家介绍以及其他相关主题和项目的详细信息。
霍姆表示,用户可以一键关注某个主题的卡片,如果他们有权限,还可以提出修改建议。如果用户急需快速了解一个新词汇,Project Cortex 可以迅速提供整个组织范围内的与之相关的所有信息。智能捕获技术让 Cortex 可以从结构化内容(如表格,收据和发票)中提取信息,而通过「机器教学」—即让专家反哺 AI—Cortex 还可以从非结构化内容(例如法律合同和员工协议)中获取信息。
由 AI 生成并维护的这些「主题卡片」天然附带自我修正、更新和完善的功能。正如前面提到的,专家的建议和有权限的管理者所做的编辑,不仅能增进 AI 对某个主题的理解,还能帮助 AI 更准确地关联用户和某个领域或者项目,这些都会使组织的「大脑」变得更加智慧。
试点如火如荼 应用前景广阔 Project Cortex 目前尚属于「内测」阶段—Microsoft 365 已经将 Project Cortex 部署到了 13 家企业和组织进行了小范围的试点,并且还在持续招募更多的组织合作进行试点。该项目预计在明年上半年正式推出英语版本,其他语言的版本也计划于明年晚些时候上线。但推出的具体套装形式和价格暂时还不确定。
Project Cortex 暂时还未部署到除 Microsoft 365 以外的产品线—如 Dynamics 365 中。但在 M365 的版本发布之后,D365 也将会是下一步的部署目标。
总部位于伦敦的全球工程管理和开发咨询公司 Mott MacDonald 是 Project Cortex 的试点公司之一。Mott MacDonald 每年处理数千个复杂项目,包括制定总体规划以改造纽约的约翰·肯尼迪国际机场,在西雅图用一条巨大的隧道取代双层道路,借助分析技术确保新西兰的游泳者免受水污染的侵害等等。由于 Mott MacDonald 不生产实体产品,这家公司的运营主要依托于其 16,000 多名员工的专业知识。
Mott MacDonald 已在享受 Project Cortex 提高知识积累和共享的效率,帮助员工快速学习和成长的潜力。该公司的生产力应用程序架构师西蒙·丹顿(Simon Denton)表示,Project Cortex「能帮助我们更快接触和了解到其他同事和他们各自的专长,这种快速关联思维将能增强我们实现业务目标的能力」。
斯派塔罗认为咨询公司或将会成为 Project Cortex 最大的潜在客户。他说,任何以服务为基础的企业都能利用 Project Cortex 提升工作效率,并且不需担心安全性和合规性的问题。
在 Cortex 中,知识图谱技术是网络的核心,但在这个项目上,微软对于数据的应用与其他巨头有着很大的不同。斯派塔罗说。「谷歌把他们的图谱卖给了广告商,Facebook 把图谱卖给了广告商,微软的不同之处在于,我们把图谱技术反过来还给你们(用户)。」