JAVA操作XML的方法以及XALAN, XERCES, CRIMSON三者的关系

 Java语言编程中更新XML文档的四种方法。第一种方法是直接读写XML文件。第二种方法是使用Apache Crimson的XmlDocument类,这种方法极为简单,使用方便,如果你选用Apache Crimson作为XML解析器,那么不妨使用这种方法,不过这种方法似乎效率不高(源于效率低下的Apache Crimson),另外,高版本的JAXP或者是Java XML Pack、JWSDP不直接支持Apache Crimson,亦即这种方法不通用。第三种方法是使用JAXP的XSLT引擎(Transformer类)来输出XML文档,这种方法也许是标准的方法 了,使用起来十分灵活,特别是可以自如控制输出格式,我们推荐采用这种方法。第四种方法是第三种方法的变种,采用了Xalan XML Serializer,引入了串行化操作,对于大量文档的修改/输出有优越性,可惜的是要重复设置XSLT引擎的属性和XML Serializer的输出属性,比较麻烦,而且依赖于Apache Xalan和Apache Xerces技术,通用性略显不足。除此之外,实际上应用别的API(比如dom4j、JDOM、Castor、XML4J、Oracle XML Parser V2)也有很多办法可以更新XML文档。

概念介绍

Xerces/Crimson是XML解析器,Xalan是XSLT处理器,xml-apis.jar实际上是JAXP。

ApacheCrimson的前身是SunProjectXParser,至今ApacheCrimson的很多代码都是从XParser中直接移植过来的。早期的JAXP是和XParser捆绑在一起的。后来的JAXP和ApacheCrimson捆绑在一起,比如JAXP1.1。最新的JAXP1.2EA(EarlyAccess)改弦更张,采用性能更好的ApacheXalan和ApacheXerces分别作为XSLT处理器和XML解析器,不能直接支持ApacheCrimson了。

dom4j(dom4j.jar)是一个Java的XMLAPI,类似于jdom,用来读写XML文件的。dom4j是一个非常非常优秀的JavaXMLAPI,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。在IBMdeveloperWorks上面可以找到一篇文章,对主流的JavaXMLAPI进行的性能、功能和易用性的评测,dom4j无论在那个方面都是非常出色的。