人工智能技术下的知识图谱
人工智能重新火起来之后,谈到AI技术,人们首先会联想到深度学习、机器学习技术;谈到AI应用,人们很可能会马上想起语音助理、自动驾驶等等,但是如果你一直关注AI的话,会发现,知识图谱在不知不觉中被越来越多的谈起。这也的确是AI不能不提的依托技术。我们在进行人工智能探索的道路上,需要了解其本质,在其基础上衍生出各种上层的智能应用。知识图谱正是起到了这样一个作用。
知识图谱不难理解,就是通过不同知识的关联性形成一个网状的知识结构,形成知识图谱的过程本质是在建立认知。知识图谱最能体现人工智能的特色——像人类大脑一样思考!因为人类最擅长的思考方式就是将点和线关联起来并由点及面,然后抽丝剥茧,慢慢理清其中的逻辑推理关系。
在国外,谷歌最早提出知识图谱这个词,作为谷歌的两大重要技术储备,一个是深度学习,另一个就是知识图谱,用来支撑下一代搜索和在线广告业务。在国内,百度最近明显加大了对知识图谱的宣传,其实力我们不得而知,但其应用方式和谷歌有类似之处。从现在来看,将知识图谱实现行业垂直应用的凤毛麟角。
既然知识图谱如此重要,如此具有价值,那为什么应用案例几乎没有呢?我想被誉为AI领域宗师的加州大学伯克利分校计算机教授、美国国家科学院院士 Michael I. Jordan的一句话多少能说明一些问题。他说:"如果有10亿美金的话,自然语言的理解是我最想研究的问题"。自然语言理解,这一知识图谱的依托技术之一是非常重要,但同时也是非常难做的一件事。
除了NLP技术本身存在难度外,还在于建立行业知识图谱,要对行业建立起深厚的认知,需要长时间的行业积淀,这是知识图谱垂直应用少的另外一个原因。因为只有理解了行业和场景,才能真正智能化。比如我们可能认为很简单的零售行业,如果真要实现个性化的商品推荐,机器必须理解不同商品的特性,以及商品与销售场景(如季节、地区、时段)、与促销行为、与用户需求之间的关系,才能推荐满足用户需求的产品。这也是一个优秀的推销员或商场导购的思考逻辑。针对不同的零售细分领域,可能又要建立完全不同的知识图谱。
一些信息化走在前面的公司,其中有一家大型能源集团公司,他们目前正在做这件事情,他们把自己做的叫"知识管理、知识工程",但背后的支撑就是知识图谱。
这家公司通过知识管理项目建成了专业知识网。业务人员可以通过基于知识图谱的一站式搜索,快速查找到所需资料及专业知识,可以基于知识图谱进一步对这些知识进行分析挖掘,支撑解决科研与生产中的问题。业务人员工作过程和交流过程中所产生的新知识又回归到知识库,进一步通过知识图谱进行推送、共享和复用。
他们提出的企业知识网解决方案分三步:第一步,先把企业开展工作需要哪些关键知识识别出来,找到源头,不管是企业内部的还是外部的,不管是数据库、文档库还是网页,都汇聚起来;第二步,是通过知识图谱,让系统能"认识理解"这些数字和文字代表的含义,把各个源头的知识抽取出来,把知识和人都关联起来,形成一张知识网;第三步,让知识围绕业务转起来,实现智能化应用,包括语义搜索、个性化推荐、智能问答、协同研究、决策支持等等。
总之,知识图谱是未来AI发展的必经之路,行业化知识图谱的构建有难度,更有价值。