SAX和DOM解析XML区别

分享才能进步

2015-03-28

本文转载自：http://blog.csdn.net/zhangxinrun/article/details/5678118

还有一篇文章总结的也不错：http://www.kaifajie.cn/kecheng/java/7625.html借鉴一下，学习学习

当你需要处理XML文档时，你的首要选择是使用DOM(文档对象模型)还是使用SAX(用于XML的简单API)，即当前使用的两个主要的XMLAPI。你可以使用任何一种(或者在同一时间使用两种)来处理XML文档，然而DOM将文档载入到内存中处理，而SAX则相反，它可以检测一个即将到来的XML流，由此并不需要所有的XML代码同时载入到内存中。

选择DOM与SAX，与在一个数据库中的表单与视图之前选择一样：选择适合于当前实际情况的方法。如果你只是想简单地查看XML文档而不处理它，那么请选择使用SAX。

SAX与DOM之间的区别

SAX与DOM之间有一些显著区别，包括：

DOM是复杂对象处理的首选，比如当XML比较复杂的时候，或者当你需要随机处理文档中数据的时候。SAX从文档的开始通过每一节点移动，以定位一个特定的节点。

DOM为载入到内存的文档节点建立类型描述。最终，这些描述呈现了可容易横向移动、潜在巨大、树型结构。如果XML很冗长，DOM就会显示出无法控制的胀大。例如，一个300KB的XML文档可以导致RAM或者虚拟内存中的3，000，000KB的DOM树型结构。通过比较就会发现，一个SAX文档根本就没有被解构，它也没有隐藏在内存空间中(当然当XML流被读入时，会有部分文档暂时隐藏在内存中)。SAX就是一种“更轻巧的”技术──它可以给你的系统带来更轻的负担。SAX相当于观看一场马拉松比赛，而DOM就好比邀请所有的比赛选手到家里参加晚餐。

所以，你如何选择SAX和DOM？如果你处理复杂的东西，比如高级XSLT转换，或者Xpath过滤，请选择使用DOM。如果你建立或者更改XML文档，你也可以选择DOM。

相反，你可以使用SAX来查询或者阅读XML文档。SAX可以快速扫描一个大型的XML文档，当它找到查询标准时就会立即停止，然后再处理之。

在某些情况下，在一个方案中，最佳的选择是使用DOM和SAX处理不同的部分。例如，你可以使用DOM将XML载入到内存并改变它，然后通过从DOM树中发送一个SAX流而转移最后的结果。

SAX概念

SAX是SimpleAPIforXML的缩写，它并不是由W3C官方所提出的标准，可以说是“民间”的事实标准。实际上，它是一种社区性质的讨论产物。虽然如此，在XML中对SAX的应用丝毫不比DOM少，几乎所有的XML解析器都会支持它。

与DOM比较而言，SAX是一种轻量型的方法。我们知道，在处理DOM的时候，我们需要读入整个的XML文档，然后在内存中创建DOM树，生成DOM树上的每个Node对象。当文档比较小的时候，这不会造成什么问题，但是一旦文档大起来，处理DOM就会变得相当费时费力。特别是其对于内存的需求，也将是成倍的增长，以至于在某些应用中使用DOM是一件很不划算的事（比如在applet中）。这时候，一个较好的替代解决方法就是SAX。

SAX在概念上与DOM完全不同。首先，不同于DOM的文档驱动，它是事件驱动的，也就是说，它并不需要读入整个文档，而文档的读入过程也就是SAX的解析过程。所谓事件驱动，是指一种基于回调（callback）机制的程序运行方法。（如果你对Java新的代理事件模型比较清楚的话，就会很容易理解这种机制了）

在XMLReader接受XML文档，在读入XML文档的过程中就进行解析，也就是说读入文档的过程和解析的过程是同时进行的，这和DOM区别很大。解析开始之前，需要向XMLReader注册一个ContentHandler，也就是相当于一个事件监听器，在ContentHandler中定义了很多方法，比如startDocument()，它定制了当在解析过程中，遇到文档开始时应该处理的事情。当XMLReader读到合适的内容，就会抛出相应的事件，并把这个事件的处理权代理给ContentHandler，调用其相应的方法进行响应

xml语言 dom sax解析xml xml数据库

安科网

SAX和DOM解析XML区别

分享才能进步

分享才能进步

相关推荐

用DOM实现对XML文件的解析

一个快速找到Spring框架是在哪里找到XML配置文件并解析Beans定义的小技巧

浅谈XML和JSON的区别

类转json、 json转xml的方法，转SortedDictionary转 xml 的方法。

新Jenkins实践-第4章 Jenkins系统用户认证配置管理

springmvc常用方法以及注解

javascript实用

AI芯片加速图像识别

Spring解析Xml注册Bean流程

ApplicationContext 通常的实现是什么?

Spring 的历史

Wide-Bandgap宽禁带（WBG）器件（如GaN和SiC）市场将何去何从？

5G和AI机器人平台

嵌入式C程序基础与编程结构

英特尔图形处理器第8代架构

【AJAX】Asynchronous JavaScript And XML （非同步的JS & XML）

Ajax(2) —— Ajax接收JSON数据

ApplicationContext 通常的实现是什么?

SpringMVC零xml配置原理

spring的IOC容器ApplicationContext和BeanFactory

分享才能进步