Java—IO流 文件的编码

  • 文件的编码
package cn.test;

import java.io.UnsupportedEncodingException;

public class Demo15 {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String str = "你好ABC123";
        byte[] b1 = str.getBytes();//转换成字节系列用的是项目默认的编码
        for (byte b : b1) {
            //把字节(转换成了int)以十六进制方式显示
            System.out.print(Integer.toHexString(b & 0xff) + "  ");
        }
        
        System.out.println("");
        //utf8编码,中文占用3个字节,英文和数字占用1个字节
        byte[] b2 = str.getBytes("utf8");
        for (byte b : b2) {
            System.out.print(Integer.toHexString(b & 0xff) + "  ");
        }
        
        System.out.println("");
        //gbk编码,中文占用两个字节,英文和数字占用1个字节
        byte[] b3 = str.getBytes("gbk");
        for (byte b : b3) {
            System.out.print(Integer.toHexString(b & 0xff) + "  ");
        }
        
        System.out.println("");
        //java是双字节编码 utf-16be
        //utf-16be编码,中文占2个字节,英文和数字也占用2个字节
        byte[] b4 = str.getBytes("utf-16be");
        for (byte b : b4) {
            System.out.print(Integer.toHexString(b & 0xff) + "  ");
        }
        
        System.out.println("");
        //当字节序列是某种编码时,这时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码
        String str1 = new String(b4);//使用项目默认的编码
        System.out.println(str1);
        String str2 = new String(b4, "utf-16be");
        System.out.println(str2);
    }
}

执行结果:

e4  bd  a0  e5  a5  bd  41  42  43  31  32  33  
e4  bd  a0  e5  a5  bd  41  42  43  31  32  33  
c4  e3  ba  c3  41  42  43  31  32  33  
4f  60  59  7d  0  41  0  42  0  43  0  31  0  32  0  33  
O`Y}ABC123
你好ABC123

文本文件就是字节序列,可以是任意编码的字节序列。

如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码(中文系统下,ansi编码代表gbk编码)

相关推荐