智通分享 | 知识图谱是人工智能的基石
进入21世纪以来,人工智能依靠机器学习和深度学习取得了快速进展,但对于机器的训练,需要人类的监督以及大量的数据来喂养,而这些数据需要大量的人工去堆砌,对于强人工智能而言,这是不可取的。要实现真正的类人智能,机器还需要掌握大量的常识性知识,以人的思维模式和知识结构来进行语言理解、视觉场景解析和决策分析。
知识图谱是人工智能的基石
知识图谱用节点和关系所组成的图谱,为真实世界的各个场景直观地建模。通过不同知识的关联性形成一个网状的知识结构,对机器来说就是图谱。
形成知识图谱的过程本质是在建立认知、理解世界、理解应用的行业或者说领域。每个人都有自己的知识面,或者说知识结构,本质就是不同的知识图谱。正是因为有获取和形成知识的能力,人类才可以不断进步。
知识图谱对于人工智能的重要价值在于,知识是人工智能的基石。机器可以模仿人类的视觉、听觉等感知能力,但这种感知能力不是人类的专属,动物也具备感知能力,甚至某些感知能力比人类更强,比如:狗的嗅觉。
而“认知语言是人区别于其他动物的能力,同时,知识也使人不断地进步,不断地凝练、传承知识,是推动人不断进步的重要基础。” 知识对于人工智能的价值就在于,让机器具备认知能力。
而构建知识图谱这个过程的本质,就是让机器形成认知能力,去理解这个世界。
知识图谱的技术:
知识图谱以语义分析技术为基础,以模型为核心,基于数据,利用深度神经网络、NLP框架语义理解等智能处理技术对输入的字、词、篇章进行多层次、多维度的信息分析,提供可远程调用的实体抽取、关系抽取和属性抽取等算法服务接口能力。领域知识图谱构建平台能够服务不同行业和应用场景。
构建知识图谱是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代可分为三个阶段:
- 信息抽取:从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;
- 知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;
- 知识加工:对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量。
知识图谱的未来发展
“纯粹的通用型人工智能没有任何意义,人工智能未来的方向一定是行业化。”
因此行业知识图谱的构建显得尤为重要,首先,构建行业知识图谱系统应以海量数据汇聚融合、快速感知和认知、强大的分析和推理、自适应与自优化和行业智能决策为导向。
通用知识图谱和行业知识图谱构建区别:
通用知识图谱以互联网开放数据为基础,以三元组事实型知识为主,较多的面向开放域的Web抽取,对知识抽取的质量有一定容忍度,以知识融合提升数据质量,应用领域主要在搜索和问答方面,对推理要求较低。
行业知识图谱以领域或企业内部的数据为主要来源,通常要求快速扩大规模,构建行业壁垒,知识结构更加复杂。知识抽取的质量要求很高,较多的依靠从企业内部的结构化、非结构化以及半结构化数据进行联合抽取,需要依靠人工进行审核校验,来保证质量。通常多来源的领域融合是数据扩大规模的有效手段。行业知识图谱的应用形式很全面,除搜索问答外,还包括决策分析、业务管理等,对推理的要求更高,并有较强的可解释性要求。
大数据的采集分析和计算力已经不再是阻碍,难点在于算法背后的知识图谱构建。实际中,企业数据和业务变化灵活,因此数据源、数据结构、数据内容随时会发生变动,对业务的理解以及对数据的解读也随之发生变化。因此,建立实时敏捷、灵活可扩展、智能自适应的动态知识图谱尤为重要。
行业知识图谱的重要性
由于IT时代的快速发展,形成了数据的聚集,促进了DT时代的来临,数据与算法作为基础为知识图谱的构建提供了新的可能性,而知识图谱作为AI的支撑基础,虽然发展缓慢,却是人工智能的必经之路。其在语义搜索、智能问答、数据分析、自然语言处理、视觉理解等方面已展现出越来越大的价值。
基于语音对话系统构建的机器人,要想机器人好玩有趣,就需要建立通用知识图谱,使机器人具有强大的逻辑,了解人与人的关系,人与物的关系,人的属性、物的属性,理解人类世界的关系链,灵活应对用户的各种聊天需求,使机器具有类人智能。而行业知识图谱则帮助用户解答关于行业的任务型需求,辅助用户决策,反向帮助人类学习。
智通科技为某油田专属打造的智能问答机器人,基于油气知识图谱并使用分词、实体识别与消歧等自然语言处理技术,将用户输入的自然语言中包含的实体与知识图谱中的实体进行准确链接,使机器人可以理解用户输入的自然语言中包含的真正意图,从行业知识图谱中抽取精确的内容对用户进行直接问答、统计问答、推理问答。
智通科技智能问答机器人小K
如今,人工智能属于发展初期,主要以技术驱动行业发展,企业在以行业+AI为核心的同时,更应重视行业+知识图谱。未来技术肯定不是公司的核心竞争力,而多年积累的行业数据才是壁垒,数据养育AI,AI反哺数据。
智通科技构建石化行业知识图谱,建立千万级的知识网络关联节点
智通科技研发团队拥有近十年行业浸润与技术积淀,形成了行业知识图谱构建与应用的解决方案,并已在石油石化、军工、政府等行业应用。智通科技为中国石化建立了集团级知识管理平台,从百万数据与信息中抽取知识点,基于勘探开发知识体系的框架,构建行业知识图谱,形成勘探开发科研特色知识库。实现了知识图谱在复杂业务中实现多源异构大数据的融合汇聚、分析挖掘,并通过搜索、问答、推荐等智能化知识服务,帮助业务人员快速、全面、准确解答关于行业的知识需求,有效提升业务洞察力、提高整体工作效率与质量。
智通科技作为专注于利用人工智能技术赋能企业智慧化转型的国家高新技术企业,利用先进的知识图谱、自然语言处理、大数据、物联网等技术与产品,构筑智慧语义、智能制造两大核心业务,并打造语义魔方、知识工程平台、数字工厂平台三大旗舰产品,为行业用户提供领先的产品和解决方案,是基于新一代AI技术的智能制造领航者。
未来智通科技将充分利用新一代AI技术,赋能更多的企业在智能化转型的路上走的更高更远。