Java—IO流 文件的编码
- 文件的编码
package cn.test; import java.io.UnsupportedEncodingException; public class Demo15 { public static void main(String[] args) throws UnsupportedEncodingException { String str = "你好ABC123"; byte[] b1 = str.getBytes();//转换成字节系列用的是项目默认的编码 for (byte b : b1) { //把字节(转换成了int)以十六进制方式显示 System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //utf8编码,中文占用3个字节,英文和数字占用1个字节 byte[] b2 = str.getBytes("utf8"); for (byte b : b2) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //gbk编码,中文占用两个字节,英文和数字占用1个字节 byte[] b3 = str.getBytes("gbk"); for (byte b : b3) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //java是双字节编码 utf-16be //utf-16be编码,中文占2个字节,英文和数字也占用2个字节 byte[] b4 = str.getBytes("utf-16be"); for (byte b : b4) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //当字节序列是某种编码时,这时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码 String str1 = new String(b4);//使用项目默认的编码 System.out.println(str1); String str2 = new String(b4, "utf-16be"); System.out.println(str2); } }
执行结果:
e4 bd a0 e5 a5 bd 41 42 43 31 32 33 e4 bd a0 e5 a5 bd 41 42 43 31 32 33 c4 e3 ba c3 41 42 43 31 32 33 4f 60 59 7d 0 41 0 42 0 43 0 31 0 32 0 33 O`Y}ABC123 你好ABC123
文本文件就是字节序列,可以是任意编码的字节序列。
如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码(中文系统下,ansi编码代表gbk编码)
相关推荐
周游列国之仕子 2020-09-21
hedongli 2020-09-01
liusarazhang 2020-06-28
TammyJi 2020-06-14
89411051 2020-06-14
JF0 2020-06-13
88384957 2020-06-12
FORYAOSHUYUN 2020-06-11
84590091 2020-06-08
88540591 2020-06-01
cenylon 2020-05-25
CloudXli 2020-05-16
cherayliu 2020-05-11
kaixinfelix 2020-03-27
liusarazhang 2020-05-01
81214051 2020-04-25
84590091 2020-04-22
Dimples 2020-04-18
ITxiaobaibai 2020-03-23