java解析XML① 之DOM解析和SAX解析(包含CDATA的问题)
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;SAX采用事件驱动的方式解析XML。如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。
<?xml version="1.0" encoding="utf-8"?> <Students> <Student num="001"> <name>小明</name> <age>20</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="002"> <name>小红</name> <age>21</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="003"> <name>小蓝</name> <age>23</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="004"> <name>小白</name> <age>19</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="005"> <name>小林子</name> <age>18</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="006"> <name>小东子</name> <age>20</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="007"> <name>小左子</name> <age>21</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="008"> <name>小张</name> <age>22</age> <subject><![CDATA[数学&英语]]></subject> </Student> <Student num="009"> <name>小明</name> <age>23</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> <Student num="010"> <name>小明</name> <age>20</age> <subject><![CDATA[数学&英语]]></subject> <sport>篮球</sport> </Student> </Students>
DOM解析
package cn.yangtze.domtext; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class DomPractice { public static void main(String[] args) { // TODO Auto-generated method stub // 创建一个DocumentBuilderFactory的对象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // 创建一个DocumentBuilder的对象 try { // 创建DocumentBuilder对象 DocumentBuilder db = dbf.newDocumentBuilder(); // 通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下 Document document = db.parse("Students.xml"); // 获取所有Student节点的集合 NodeList StudentList = document.getElementsByTagName("Student"); // 通过nodelist的getLength()方法可以获取StudentList的长度 System.out.println("DOM解析开始..."); // 遍历每一个Student节点 for (int i = 0; i < StudentList.getLength(); i++) { System.out.println("开始解析第" + (i + 1) + "个学生"); // 通过 item(i)方法 获取一个Student节点,nodelist的索引值从0开始 Node book = StudentList.item(i); // 获取Student节点的所有属性集合 NamedNodeMap attrs = book.getAttributes(); // 遍历Student的属性 for (int j = 0; j < attrs.getLength(); j++) { // 通过item(index)方法获取Student节点的某一个属性 Node attr = attrs.item(j); // 输出学生的属性名和属性值 System.out.println(attr.getNodeName() + ":" + attr.getNodeValue()); } NodeList childNodes = book.getChildNodes(); // 遍历childNodes获取每个节点的节点名和节点值 for (int k = 0; k < childNodes.getLength(); k++) { // 区分出text类型的node以及element类型的node if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) { // 输出子节点的属性名和属性值 System.out.println(childNodes.item(k).getNodeName() + ":" + childNodes.item(k).getFirstChild().getNodeValue()); } } } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } System.out.println("DOM解析结束..."); } }
SAX解析
SAXParserHandler.java
package cn.yangtze.saxtext; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class SAXParserHandler extends DefaultHandler { private int StudentIndex = 0; // 解析开始的标志 @Override public void startDocument() throws SAXException { System.out.println("SAX解析开始..."); } // 解析结束的标志 @Override public void endDocument() throws SAXException { System.out.println("SAX解析结束..."); } // 用来遍历XML文件的开始标签 @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { // 调用DefaultHandler类的startElement方法 super.startElement(uri, localName, qName, attributes); // 开始解析Student元素节点 if (qName.equals("Student")) { ++StudentIndex; System.out.println("开始解析第" + StudentIndex + "个学生"); //输出XML属性,也就是XML文件中的num属性,注意在因使用属性而引起的一些问题: /*1 ,属性无法包含多重的值(元素可以) 2,属性无法描述树结构(元素可以) 3,属性不易扩展(为未来的变化) 4,属性难以阅读和维护 5,请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。*/ for (int i = 0; i < attributes.getLength(); ++i) { System.out.println(attributes.getQName(i) + ":" + attributes.getValue(i)); } } else if (!qName.equals("Students")) { System.out.print(qName + ":");//输出元素值 } } // 用来遍历XML文件的结束标签 @Override public void endElement(String uri, String localName, String qName) throws SAXException { super.endElement(uri, localName, qName); // 判断一个学生是否解析完 if (qName.equals("Student")) { System.out.println("结束解析第" + StudentIndex + "个学生"); } } @Override public void characters(char[] ch, int start, int length) throws SAXException { super.characters(ch, start, length); String text = new String(ch, start, length); if (!text.trim().equals("")) { System.out.println(text); } // if } }
SAXDemo.java
//SAX解析XML package cn.yangtze.saxtext; import java.io.File; import java.io.IOException; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.SAXException; public class SAXDemo { public static void main(String[] args) { File file =new File("Students.xml"); try { // 通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory SAXParserFactory factory = SAXParserFactory.newInstance(); // 通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser SAXParser saxParser = factory.newSAXParser(); // 定义SAXParserHandler对象 SAXParserHandler handler = new SAXParserHandler(); // 解析XML文档 saxParser.parse(file, handler); } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }
相关推荐
Yakamoz 2020-05-26
与卿画眉共浮生 2020-10-14
xiyang 2020-08-21
XGQ 2020-07-04
Andrewjdw 2020-05-29
行吟阁 2020-05-18
88491874 2020-04-30
baijinswpu 2020-07-29
leonranri 2020-07-26
zhongliwen 2020-07-05
麋鹿麋鹿迷了路 2020-07-05
zengyu00 2020-07-05
CoderBoy 2020-06-28
whbing 2020-06-28
绝望的乐园 2020-06-27
wellfly 2020-06-26
菇星獨行 2020-06-25
草原孤狼 2020-06-25
坚持着执着 2020-06-16