XML的解析方法
XML最为一种通用的数据交换格式,它与语言、平台、系统的无关性而给数据集成与交换带来了很大的便利。对于XML本身的语法和知识有DTD(document type definition),SAX(sample api for xml),DOM(document object model),XSD(xml schema definition),XSTL(Extensible stylesheet language transformations).
XML在不同的语言中解析的方式一样,只不过实现的语言不同,基本解析有两种:SAX(基于事件流的方式),另外一种是DOM(基于XML文档树结构的方式)
一、DOM
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU).
//获取DOM工厂对象 DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance(); //从 DOM 工厂获得 DOM 解析器 DocumentBuilder dombuilder=domfac.newDocumentBuilder(); //把要解析的 XML 文档转化为输入流,以便 DOM 解析器解析它 InputStream is= new FileInputStream("test1.xml"); //解析 XML 文档的输入流,得到一个 Document Document doc=dombuilder.parse(is); //得到 XML 文档的根节点 Element root=doc.getDocumentElement(); //得到节点的子节点 NodeList books=root.getChildNodes(); //获得集合中的第i 个节点 Node book = books.item(i); //根据Node对象获取所有的值,可查看Node的API
二、SAX
当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载。缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;
三、DOM4j
DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。
四、JDOM
为减少DOM、SAX的编码量,出现了JDOM;优点:20-80原则,极大减少了代码量。使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。