W3C:XML无处不在
随着万维网联盟(W3C)放弃其标准化可扩展标记语言(XML)的工作,它正在回顾使XML在今天取得成功的历史。
“W3C XML是可扩展标记语言,是世界上使用最广泛的表示和交换信息的格式之一。最终的XML堆栈比许多人都知道的更强大,更容易使用,特别是对于那些从早期就可能没有使用过XML的人,“Liam Quin,最近宣布他将在17岁之后离开W3C的XML活动负责人在一篇文章中写道,与XML合作多年。
XML 1.0于1998年2月10日首次作为W3C推荐出版,作为解决大规模电子出版问题的一种方法。今天,它是一种标记语言,用于定义编码人类和机器可读文档的规则。
据软件开发公司Altova的总裁兼首席执行官Alexander Falk称,XML的发展和成功被广泛误解。“今天,我们认为理所当然的很多东西 - 有时甚至不再认为与XML有关 - 实际上都是基于XML的。每个Word文档,Excel电子表格和PowerPoint演示文稿都以OOXML(Open Office XML)格式存储。每当您在美国(以及许多其他司法管辖区)以电子方式提交税款时,信息都会以税号格式从您的税务软件提供商发送给政府。每当上市公司向SEC提供季度和年度财务报告时,数据都以XBRL(XML格式)传输。每次与Alexa设备通信时,您都会与使用SSML(语音合成标记语言,XML格式)的应用程序进行交互。
根据W3C的Quin,XML可以与JSON,链接数据,文档,大型数据库,物联网,汽车,飞机甚至音乐播放器一起使用。“甚至还有XML鞋子。无处不在,“他说。
但是,我们是怎么来到这里的?W3C创建了Web标准通用标记语言(SGML)工作组,以创建要在Web和浏览器插件中共享和显示的SGML规范。虽然XML与HTML非常相似,但W3C解释说其意图不是取代HTML。XML旨在传输数据; HTML旨在显示数据。XML标签不是预定义的,HTML标签也是如此,因此两者之间仍存在许多差异。
当Web SGML工作组正在研究SGML规范时,有两个插件:SoftQuad的Panorama和从未发布的EBT / Inso。W3C意识到需要一个标准,因为很明显,开发一个支持这两个插件的SGML文档太复杂了。“XML的语法有一些冗余。我们从SGML的经验中了解到,与程序数据不同,文档通常难以测试,冗余有助于及早发现错误,并且可以节省高达80%的支持成本(我们在SoftQuad上进行了测量)。冗余与基于语法的检查相结合,使用各种模式,有助于提高XML系统的可靠性。而且,使用xml:lang对多语言文档的内置支持是第一次,并且是持久的成功,“Quin写道。
今天,Quin认为XML的大部分工作已经完成。“人们在生产中使用这些规格,并且勘误的速度已经放慢了,”他解释道。
然而,根据Quin的说法,W3C规范的结束并不意味着XML正在结束,它只是意味着它已经达到了广泛部署的成熟阶段。“人们没有报告很多新问题,因为问题已经解决了,”Quin写道。
Altova的Falk认为XML的未来看起来很光明。“随着它变得越来越普遍,人们会更容易忘记不同系统之间流动的大部分数据是基于XML的,但这并不意味着它变得越来越不重要,”福尔克写道。“由于XML的核心已经成熟并经过多年的改进,我们已经看到一系列支持标准出现,有助于处理,构建,转换,查询和格式化XML数据 - 所有这些标准都汇集在一起,以建立丰富的基础设施。相关技术,包括XML Schema,XSLT,XSL-FO,XPath,XQuery,XBRL等,它们支持跨越操作系统,平台和软件产品的基于标准的信息处理。“
“但在大多数情况下,是时候坐下来享受表达信息,处理信息,交换信息,提高稳健性和效率的能力。有很多机会可以探索如何合理,合理地使用XML技术,“Quin补充道。