dom4j解析
一:构建dom4j树(表示为Document元素)
常用方法:
方式一:直接创建所有元素:dom4j为我们准备了工具类DocumentHelper,该类的所有的方法都是静态方法,用来创建xml文档的各个组成部分。
1.1.1创建Document和Element对象:
Documentdoc=DocumentHelper.createDocument();
ElementeltRoot=DocumentHelper.createElement(“student”);
doc.setEltRootElement(eltRoot);
1.1.2或者先准备好根元素,使用有参数的构造方法创建Document对象。
ElementeltRoot=DocumentHelper.createElement(“student”);
Documentdoc=DocumentHelper.createDocument(eltRoot);
1.2:添加节点和设置节点内容:
方法:Branch接口中定义的方法;
publicElementaddElemen(Stringname)//以指定的name为当前节点创建一个子节点,并返回新节点的引用
publicvoidsetText(Stringtext)//将content设置为节点的内容
示例如下:
ElementeltName=eltRoot.addElement(“name”);
ElementeltAge=eltRoot.addElement(“age”);
eltName.setText(“张三”);
eltAge.setText(“18”);
1.3:添加属性
方法:publicElementaddAttribute(Stringname,Stringvalue)
示例如下:
eltRoot.addAttribute(“sn”,”01”);
方式2:
2.1:org.dom4j.io提供了两个类:SAXReader和DOMReader,前者从一个现有的w3cDOM树构建dom4j树,而SAXReader则使用SAX解析器,从不同的输入源构建dom4j树。
2.1.1:使用SAXReader构建dom4j文档对象:示例如下:
SAXReadersaxReader=newSAXReader();
Filefile=newFile(“student.xml”);
Documentdoc=saxReader.read(file);
2.2.1:使用DOMReader构建dom4j文档对象.
DocumentBuilderFactorydbf=newDocumentBuilderFactory.newInstance();
DocumentBuilderdb=dbf.newDocumentBuilder();
Filefile=newFile(“student.xml”);
org.w3c.dom.Documentdocument=db.parse(file);
DOMReaderdomReader=newDOMReader();
org.dom4j.Documentdoc=domReader.read(document);
访问根节点:
Elementroot=doc.getRootElement();
访问节点:
访问所有节点:
java.util.ListchildrenList=elt.elements();
访问指定名称的所有节点
java.util.LiatchildrenList=elt.elements(“student”);
访问指定名称第一个节点
ElementeltChild=elt.element(“student”);
要迭代某个元素的所有子元素:
for(java.util.Iteratorit=root.elementIterator();it.hasNext()){
Elementelement=it.hasNext();
……
}
Dom4j中集成了对XPath的支持。在选择节点时,可以直接使用XPath表达式,例如:
要选择例子文件students.xml中的所有的<name>元素,代码如下:
java.util.Listl=root.selectNodes(“//name”);
要选择属性sn的值等于01的<student>元素,代码如下:
java.util.Listl=root.selectNodes(“//student[@sn=’01’]”);
注意:为了能够编译执行上述使用XPath表达式的代码,需要配置dom4j安装包中自带的jaxen包,你也可以从http://sourceforge.net/products/jaxen/上下载jaxen。jaxen是一个用java开发的XPath引擎,用于配合各种基于XML的对象模型,如DOM,dom4j和JDOM。在dom4-1.6.1目录下,有一个lib子目录,其中有个jaxen-1.1-beta-6.jar文件,需要在classpath环境变量中配置该文件的全路径名。
访问属性:
要得到某个元素的所有属性,,如下:
java.util.ListattrList=elt.attributes();
要得到指定的属性,如下:
Attributeattr=elt.attribute(“sn”);
要得到某个属性的值;如下:
StringattrValue=elt.attributeValue(“sn”);
删除节点和节点的属性:
要删除某个元素::可以用Branch接口中定义的remove()方法,如下:
ElementeltStu=root.element(“student”);
root.remove(eltStu);
要删除某个属性;如下:
elt.remove(elt.attribute(“sn”));
输出文档:
对象:XMLWriter实例方法:write(Documentdoc)
常用的几种构造方法总结:
1:无参数:
2:字节流参数
3:字符流参数。
4:文档输出格式类参数。
示例代码1:
输出文档内容到控制台
XMLWriterxw=newXMLWriter();
xw.write(doc);
示例代码2:
输出文档内容到文件。构造XMLWriter对象的时候,可以传递字节流参数。其底层代码设置了自动刷新机制。
XMLWriterxw=newXMLWriter(newjava.io.FileOutputStream(“student.xml”));
xw.write(doc);
示例代码3:
构造XMLWriter对象的时候,可以传递java.io.Writer对象。
XMLWriterxw=newXMLWriter(newjava.io.FileWriter(“student.xml”));
xw.write(doc);
xw.close();
注意:使用java.io.Writer对象构建的XMLWriter对象,则没有设置自动刷新机制,所以在调用write()方法之后,还要调用xw.close()或者xw.flush()方法。并且XMLWriter继承自org.xml.sax.helpers.XMLFilterImpl类。它所提供的close()和flush()方法只是其内部java.io.Writer对象的flush()和close()方法的封装方法。
示例代码4:
构造XMLWriter对象的时候,可以传递文档输出格式类org.dom4j.io.OutputFormat,利用这个类,可以设置输出文档的字符编码,设置行分割符以及控制使用的缩进字符串等。
下面的代码输出格式使用4个空格作为缩进字符串,元素之间添加新行。
OutputFormatoutFmt=newOutputFormat(“”,true);
XMLWriterxw=newXMLWriter(outFmt);
xw.write(doc);
下面的代码采用美化的格式输出文档,设置字符串编码为GB2312,并且用4个空格作为缩进。
OutputFormatoutFmt=OutputFormat.createPrettyPrint();
outFmt.setEncoding(“GB2312”);
outFmt.setIndent(“”);
XMLWriterxw=newXMLWriter(outFmt);
xw.write(doc);
dom4j的名称空间信息api
常用的方法有8个。
dom4j在Element和Attribute接口中定义了获取名称空间信息的方法,这些方法和JDOM中的方法相同。如下所示:
publicjava.lang.StringgetNamespacePrefix()
该方法返回元素(属性)的名称空间前缀
publicjava.lang.StringgetNamespaceURI()
该方法返回元素(属性)的名称空间URI
publicjava.lang.StringgetName()
该方法返回元素(属性)的本地名
publicjava.lang.StringgetQualifiedName()
该方法返回元素(属性)的限定名
publicNamespacegetNamespace()
该方法返回元素本身的名称空间
publicjava.util.ListadditionalNamespaces()
返回某元素上附加的名称空间声明列表,列表中的每一个对象都是Namespace类型。这个类的方法提供了两个方法分别获得名称空间前缀和本地名。如下:
publicjava.lang.StringgetPrefix()
该方法返回名称空间前缀。
publicjava.lang.StringgetURI()
该方法返回名称空间的URI。
---------------------------------------------------
DOM4J解析技术
一.Document对象相关
(1)读取XML文件,获得document对象
eg->
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile(emp.xml"));
(2)解析XML形式的文本,得到document对象
eg->
Stringtext="元素";
Documentdocument=DocumentHelper.parseText(text);
(3)主动创建document对象
eg->
Documentdocument=DocumentHelper.createDocument();
Elementroot=document.addElement("members");//创建根节点
二.节点相关
(1)获取文档的根节点.
eg->
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile(emp.xml"));
(2)取得某节点的单个子节点
eg->
ElementmemberElm=root.element("member");//"member"是节点名
(3)取得节点的文字
eg->
DStringtext=memberElm.getText();
或者:
eg->
Stringtext=root.elementText("name");//这个是取得根节点下的name字节点的文字
(4)取得某节点下名为"member"的所有字节点并进行遍历
eg->
Listnodes=rootElm.elements("member");
for(Iteratorit=nodes.iterator();it.hasNext();){
Elementelm=(Element)it.next();//dosomething
}
(5)对某节点下的所有子节点进行遍历
eg->
for(Iteratorit=root.elementIterator();it.hasNext();){
Elementelement=(Element)it.next();//dosomething
}
(6)在某节点下添加子节点
eg->
ElementageElm=newMemberElm.addElement("age");
(7)设置节点文字.
eg->
ageElm.setText("29");
(8)删除某节点
eg->
parentElm.remove(childElm);//childElm是待删除的节点,parentElm是其父节点
(9)添加一个CDATA节点
eg->
ElementcontentElm=infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());
contentElm.getText();//特别说明:获取节点的CDATA值与获取节点的值是一个方法
contentElm.clearContent();//清除节点中的内容,CDATA亦可
三.属性相关
(1)取得某节点下的某属性
eg->
Elementroot=document.getRootElement();
Attributeattribute=root.attribute("size");//属性名name
(2)取得属性的文字
eg->
Stringtext=attribute.getText();
或者:eg->
Stringtext2=root.element("name").attributeValue("firstname");//这个是取得根节点下name字节点的属性firstname的值.
(3)遍历某节点的所有属性
eg->
Elementroot=document.getRootElement();
for(Iteratorit=root.attributeIterator();it.hasNext();){
Attributeattribute=(Attribute)it.next();
Stringtext=attribute.getText();
System.out.println(text);
}
(4)设置某节点的属性和文字
eg->
newMemberElm.addAttribute("name","sitinspring");
(5)设置属性的文字
eg->
Attributeattribute=root.attribute("name");
attribute.setText("sitinspring");
(6)删除某属性
eg->
Attributeattribute=root.attribute("size");//属性名name
root.remove(attribute);
四.将文档写入XML文件
(1)文档中全为英文,不设置编码,直接写入的形式
eg->
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"));
writer.write(document);
writer.close();
(2)文档中含有中文,设置编码格式写入的形式
eg->
OutputFormatformat=OutputFormat.createPrettyPrint();
format.setEncoding("GBK");//指定XML编码
XMLWriterwriter=newXMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();
五.字符串与XML的转换
(1)将字符串转化为XML
eg->
Stringtext="sitinspring";
Documentdocument=DocumentHelper.parseText(text);
(2)将文档或节点的XML转化为字符串
eg->
SAXReaderreader=newSAXReader();
Documentdocument=reader.read(newFile("input.xml"));
Elementroot=document.getRootElement();
StringdocXmlText=document.asXML();
StringrootXmlText=root.asXML();
ElementmemberElm=root.element("member");
StringmemberXmlText=memberElm.asXML();