Dom4j无法以UTF-8保存xml文件,Invalid byte 2 of 2-byte UTF-8 sequence

xml页面出现Invalidbyte2of2-byteUTF-8sequence错误警告。

问题描述:

最终发现这个问题是适用dom解析时无法以UTF-8保存xml文件,保存后再次读出的时候会报“Invalidbyte2of2-byteUTF-8sequence.”这样一个错误,试着使用GBK编码生成的xml文件却可以正常的被解析,保存不会出现错误,而且再次读出时,也不会在面对错误提示。

修改方法:

在...xml文件中在第一行中改变编码方式即可,如:

<?xmlversion="1.0"encoding="GBK"?>

解析:dom是应用FileWriter对象进行文件输出的,而继承下来的子类没有提供编码处理。所以保存文件时以默认的编码格式保存,对于中文windows下Java的默认编码是GBK.

相关推荐