String源码分析
其实String方面的面试题往深了延申的话,还是会延伸到JVM,所以还是希望读者对JVM有一定的了解,这样更便于理解String的设计。
String源码分析
String结构
/* Strings are constant; their values can not be changed after they are created. Stringbuffers support mutable strings.Because String objects are immutable they can be shared. Forexample: */ public final class String implements java.io.Serializable, Comparable<String>, CharSequence
源码里可以看到String被final修饰并继承了三个接口 源码注释也说到字符串是不变的; 它们的值在创建后无法更改.Stringbuffers支持可变字符串。 因为String对象是不可变的,所以它们可以共享
final
修饰类:类不可被继承,也就是说,String类不可被继承了 修饰方法:把方法锁定,以访任何继承类修改它的涵义 修饰遍历:初始化后不可更改
Comparable和Serializable
Serializable接口里为空 Comparable接口里只有一个public int compareTo(T o);方法 这两个接口不做叙述.
CharSequence
接口中的方法 length(): int charAt(): char subSequence(int,int):CharSwquence toString(): String chars(): IntStream codePoints(): IntStream
我们发现这个接口中的方法很少,没有我们常用的String方法, 那么它应该是一个通用接口,会有很多实现类,包括StringBuilder和StringBuffer
String构造方法
空参构造
public String() { this.value = "".value; }
解析
String str=new String("abc"); 1.先创建一个空的String对象 2.常量池中创建一个abc,并赋值给第二个String 3.将第二个String的引用传递给第一个String 注:如果常量池中有abc,则不用创建,直接把引用传递给第一个String
String类型初始化
public String(String original) { this.value = original.value; this.hash = original.hash; } 案例: String str=new String("str");
字符数组初始化
public String(char value[]) { this.value = Arrays.copyOf(value, value.length); } 注:将传过来的char数组copy到value数组里
字节数组初始化
byte类型的方法有8个,两个过时的
剩下六个又分为指定编码和不指定编码
不指定编码
public String(byte bytes[]) { this(bytes, 0, bytes.length); } public String(byte bytes[], int offset, int length, Charset charset) { if (charset == null) throw new NullPointerException("charset"); checkBounds(bytes, offset, length); this.value = StringCoding.decode(charset, bytes, offset, length); }
指定编码
String(byte bytes[], Charset charset) String(byte bytes[], String charsetName) String(byte bytes[], int offset, int length, Charset charset) String(byte bytes[], int offset, int length, String charsetName)
解析
byte是网络传输或存储的序列化形式, 所以在很多传输和存储的过程中需要将byte[]数组和String进行相互转化, byte是字节,char是字符,字节流和字符流需要指定编码,不然可能会乱码, bytes字节流是使用charset进行编码的,想要将他转换成unicode的char[]数组, 而又保证不出现乱码,那就要指定其解码方法
StringBUilder构造
public String(StringBuffer buffer) { synchronized(buffer) { this.value = Arrays.copyOf(buffer.getValue(), buffer.length()); } } public String(StringBuilder builder) { this.value = Arrays.copyOf(builder.getValue(), builder.length()); } 注:很多时候我们不会这么去构造,因为StringBuilder跟StringBuffer有toString方法 如果不考虑线程安全,优先选择StringBuilder
equals方法
public boolean equals(Object anObject) { if (this == anObject) { return true; } if (anObject instanceof String) { String anotherString = (String)anObject; int n = value.length; if (n == anotherString.value.length) { char v1[] = value; char v2[] = anotherString.value; int i = 0; while (n-- != 0) { if (v1[i] != v2[i]) return false; i++; } return true; } } return false; }
String重写了父类Object的equals方法 先判断地址是否相等(地址相等的情况下,肯定是一个值,直接返回true) 在判断是否是String类型,不是则返回false 如果都是String,先判断长度, 再比较值,把值赋给char数组,遍历两个char数组比较
hashcode方法
public int hashCode() { int h = hash; if (h == 0 && value.length > 0) { char val[] = value; for (int i = 0; i < value.length; i++) { h = 31 * h + val[i]; } hash = h; } return h; }
如果String的length==0或者hash值为0,则直接返回0 如果上述条件不满足,则通过算法计算hash值
intern方法
public native String intern(); 注:方法注释会有写到,意思就是调用方法时, 如果常量池有当前String的值,就返回这个值,没有就加进去,返回这个值的引用
String str1="a"; String str2="b"; String str3="ab"; String str4 = str1+str2; String str5=new String("ab"); System.out.println(str5==str3);//堆内存比较字符串池 //intern如果常量池有当前String的值,就返回这个值,没有就加进去,返回这个值的引用 System.out.println(str5.intern()==str3);//引用的是同一个字符串池里的 System.out.println(str5.intern()==str4);//变量相加给一个新值,所以str4引用的是个新的 System.out.println(str4==str3);//变量相加给一个新值,所以str4引用的是个新的 false true false false
重点: --两个字符串常量或者字面量相加,不会new新的字符串,其他相加则是新值,(如 String str5=str1+"b";)
因为在jvm翻译为二进制代码时,会自动优化,把两个值后边的结果先合并,再保存为一个常量。
String里还有很多方法,substring,replace等等,我们就不一一举例了
StringBuilder
StringBuilder和Stringbuffer这两个类的方法都很想一样,因此我们就那StringBuilder的源码作分析 等下再去看三者之间的关系和不同
结构和构造
public final class StringBuilder extends AbstractStringBuilder implements java.io.Serializable, CharSequence{ //空构造,初始大小16 public StringBuilder() { super(16); } //给予一个初始化容量 public StringBuilder(int capacity) { super(capacity); } //使用String进行创建 public StringBuilder(String str) { super(str.length() + 16); append(str); } //String创建和CharSequence类型创建,额外多分配16个字符的空间, //然后调用append将参数字符添加进来,(字符串缓冲区) public StringBuilder(CharSequence seq) { this(seq.length() + 16); append(seq); } }
解析
我们可以看到方法内部都是在调用父类的方法, 通过继承关系,我们是知道它的父类是AbstractStringBuilder, 父类里实现类Appendable跟CharSequence 接口,所以它能够跟String相互转换
父类AbstractStringBuilder
AbstractStringBuilder() { } AbstractStringBuilder(int capacity) { value = new char[capacity]; }
解析
父类里是只有两个构造方法,一个为空实现,一个为指定字符数组的容量, 如果事先知道String的长度小于16,就可以节省内存空间, 他的数组和String的不一样,因为成员变量value数组没有被final修饰, 所以可以修改他的引用变量的值,即可以引用到新的数组对象, 所以StringBuilder对象是可变的
append
append有很多重载方法,原理都差不多 我们以String举例 //传入要追加的字符串 public AbstractStringBuilder append(String str) { //判断字符串是否为null if (str == null) return appendNull(); //不为null,获得它的长度 int len = str.length(); //调用方法,把原先长度+追加字符串长度的和传入方法 ensureCapacityInternal(count + len); str.getChars(0, len, value, count); count += len; return this; } //判断是否满足扩展要求 private void ensureCapacityInternal(int minimumCapacity) { // 和-原先字符串长度是否>0 肯定是大于0的 if (minimumCapacity - value.length > 0) //调用复制空间的方法,和当参数 expandCapacity(minimumCapacity); } //开始扩充 void expandCapacity(int minimumCapacity) { //先把原先长度复制2倍多2 int newCapacity = value.length * 2 + 2; //判断newCapacity-和是否<0 if (newCapacity - minimumCapacity < 0) //小于0的情况就是你复制的长度不够,那就把和的长度给复制的长度 newCapacity = minimumCapacity; //正常逻辑怎么着都走不到这一步,新长度肯定是大于0 if (newCapacity < 0) { if (minimumCapacity < 0) // overflow throw new OutOfMemoryError(); newCapacity = Integer.MAX_VALUE; } //将数组扩容拷贝 value = Arrays.copyOf(value, newCapacity); }
insert
insert同样有很多重载方法,下面以char和String为例 insert的ensureCapacityInternal(count + 1);和上面一样,不做讲解了 public AbstractStringBuilder insert(int offset, char c) { //检查是否满足扩充条件 ensureCapacityInternal(count + 1); //拷贝数组 System.arraycopy(value, offset, value, offset + 1, count - offset); //进行复制 value[offset] = c; count += 1; return this; } public AbstractStringBuilder insert(int offset, String str) { //判断要插入的坐标是否在字符串内,不再则报数组下标越界 if ((offset < 0) || (offset > length())) throw new StringIndexOutOfBoundsException(offset); //判断要插入的是否为null if (str == null) str = "null"; //获得要插入的字符串长度 int len = str.length(); //检查是否满足扩充条件 ensureCapacityInternal(count + len); //拷贝数组 System.arraycopy(value, offset, value, offset + len, count - offset); str.getChars(value, offset); count += len; return this; }
StringBuffer
public final class StringBuffer extends AbstractStringBuilder implements java.io.Serializable, CharSequence { } 跟StringBuilder差不多,只不过在所有的方法上面加了一个同步锁
equals与==
equals
String类重写了父类equals的方法
我们先看下父类的
//直接判断地址 public boolean equals(Object obj) { return (this == obj); }
再看下String类的equals
public boolean equals(Object anObject) { //地址相等肯定为true,就不用继续往下走了 if (this == anObject) { return true; } //地址不相等的情况下,比较两个字符的内容是否一样 //把字符串方法char[]数组里,遍历比较 if (anObject instanceof String) { String anotherString = (String)anObject; int n = value.length; if (n == anotherString.value.length) { char v1[] = value; char v2[] = anotherString.value; int i = 0; while (n-- != 0) { if (v1[i] != v2[i]) return false; i++; } return true; } } return false; }
==
==比较的是内存地址
基本数据类型比较值 引用数据类型比较地址值 (对象的引用,在堆空间,String在字符串池,newString在堆空间)
根据下面案例分析一下源码
创建方式 | 对象个数 | 引用指向
String a="abc"; |1 | 常量池
String b=new String("abc");; |1 | 堆内存 (abc则是复制的常量池里的abc)
String c=new String() |1 | 堆内存
String d="a"+"bc"; |3 | 常量池(a一次,bc一次,和一次,d指向和)
String e=a+b; |3 | 堆内存
重点--两个字符串常量或者字面量相加,不会new新的字符串,
变量相加则是会new新的字符串,new出来的都在堆
总结
String被final修饰,一旦创建无法更改,每次更改则是在新创建对象 StringBuilder和StringBuffer则是可修改的字符串 StringBuilder和StringBuffer的区别 StringBuffer 被synchronized 修饰,同步,线程安全 StringBuilder并没有对方法进行加同步锁,所以是非线程安全的。 如果程序不是多线程的,那么使用StringBuilder效率高于StringBuffer。
相关推荐
abfdada 2020-08-26
凉白开 2020-07-19
Lzs 2020-10-23
聚合室 2020-11-16
零 2020-09-18
Justhavefun 2020-10-22
jacktangj 2020-10-14
ChaITSimpleLove 2020-10-06
Andrea0 2020-09-18
周游列国之仕子 2020-09-15
afanti 2020-09-16
88234852 2020-09-15
YClimb 2020-09-15
风雨断肠人 2020-09-04
卖口粥湛蓝的天空 2020-09-15
stulen 2020-09-15
pythonxuexi 2020-09-06