Web3.0、关联数据和语义网
Web 3.0: Web 2.0之后轮到谁?
Web 3.0无法解决信息超载问题。至少现在还不行,因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据,需要很长的时间才能将这些数据结构化。
去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱,让所有人随时随地地联系在一起,让整个网络更加智能。”
至少我认为,如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络,那么Web 3.0则意味着开放和结构化数据,让网络更加“聪明”。
关联数据(Linked Data): 结构化数据,但不一定是语义数据
Greg Boutin第二篇文章谈到了关联数据。他认为关联数据提供了关联结构化数据的新媒介,可以让机器更好地读取这些数据。但是,关联数据本身不会给信息增加任何语义含义,而是更好地携带语义数据,供用户访问。所以,关联数据虽然本身并不具备语义特征,但它可以在数据层面建立关联,为真正的语义网铺平道路。
关联数据这个概念来自W3C,该组织有一个关联开放数据(LOD)项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的Open Calais项目 , Freebase, 和DBpedia。这些数据集是在现有本体论(ontologies)基础之上建立的,如WordNet,FOAF, 和SKOS,然后在它们之间建立关联。
Greg Boutin在其第三篇文章中写道,关联数据格式不会创建智能数据,仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。
语义网:Google唱主角
那些以上这些趋势会如何影响语义网呢?Tim Berners-Lee 认为语义网可以用于商业目的,但现实却是,目前使用资源描述框架(RDF)的实际应用寥寥无几。
但是 RDFa(允许发布者把RDF嵌入到HTML)带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa,而雅虎早在去年就大胆地推出了搜索猴子(Search Monkey ),达到了同样的目的。
Google将在语义网主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单,它早就在研发语义技术了。
Google也并非没有竞争对手。除了雅虎,微软去年夏天收购 Powerset也是瞄准了这个市场。