XML的解析方法

XML最为一种通用的数据交换格式,它与语言、平台、系统的无关性而给数据集成与交换带来了很大的便利。对于XML本身的语法和知识有DTD(document type definition),SAX(sample api for xml),DOM(document object model),XSD(xml schema definition),XSTL(Extensible stylesheet language transformations).

XML在不同的语言中解析的方式一样,只不过实现的语言不同,基本解析有两种:SAX(基于事件流的方式),另外一种是DOM(基于XML文档树结构的方式)

一、DOM

解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU).

//获取DOM工厂对象
DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
//从 DOM 工厂获得 DOM 解析器
DocumentBuilder dombuilder=domfac.newDocumentBuilder();
//把要解析的 XML 文档转化为输入流,以便 DOM 解析器解析它
InputStream is= new  FileInputStream("test1.xml"); 
//解析 XML 文档的输入流,得到一个 Document
Document doc=dombuilder.parse(is);
//得到 XML 文档的根节点
Element root=doc.getDocumentElement();
//得到节点的子节点
NodeList books=root.getChildNodes();
//获得集合中的第i 个节点
Node book = books.item(i); 
//根据Node对象获取所有的值,可查看Node的API

二、SAX

当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载。缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;

三、DOM4j

DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。

四、JDOM

为减少DOM、SAX的编码量,出现了JDOM;优点:20-80原则,极大减少了代码量。使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。

相关推荐