结论
在 JDK 6 及以前版本,字符串常量池保存字符串对象;JDK 6 之后的版本中,既保存了字符串对象,又保存了字符串对象的引用。
背景:JVM 的内存模型有「方法区」和「堆」的划分,方法区有两种实现:「永久代」和「元空间」,前者使用 JVM 的内存,后者使用本地内存。在 JDK 6 及以前的版本,字符串对象保存在永久代的字符串常量池里。由于容易遇到内存溢出的问题,JDK 1.7 开始则将字符串常量池移到了堆中。在 JDK1.7 中,如果堆中已经创建了某字符串对象,那就没必要在字符串常量池中再创建一个一模一样的对象,直接将其引用拷贝返回就行。而 JDK 1.6 则会在字符串常量池创建一个新的一模一样的对象。
证据
1 | public static void main(String[] args) { |
JDK 6
String s = new String("1");
这种创建字符串的方式实际生成了两个字符串对象。首先,构造器中传入一个字符串对象 1
,它被放在字符串常量池。然后 JVM 会在堆中再创建一个字符串对象 1
,字符串变量 s
指向堆中这个字符串对象 1
的首地址。
当调用 s.intern()
时,由于字符串常量池已经存在字符串 1
了,所以会将字符串常量池中的字符串对象 1
返回。(JDK 7 的情况有所不同,后面会讲。)
再通过 String s2 = "1"
来给变量 s2
赋值时,会将字符串常量池中对象 1
的首地址返回给 s2
。
由于 s
指向堆中字符串对象 1
的地址,而 s2
指向字符串常量池中 1
的地址,调用 s == s2
的返回值当然是 false
。
在 String s3 = new String("1") + new String("1");
中则涉及字符串常量池中的对象 1
以及拼接而成、保存在堆中的字符串对象 11
。当调用 s3.intern();
时,由于字符串常量池中没有 11
,此时会在字符串常量池中生成一个字符串对象 11
。
同理,由于 s3
指向堆中字符串对象 11
的地址,而 s4
指向字符串常量池中 11
的地址,调用 s == s2
的返回值当然是 false
。
JDK 7
判断 s==s2
与上文一致,但是在执行 s3.intern();
时,虽然字符串常量池中还没有字符串对象,由于在上一步 String s3 = new String("1") + new String("1");
中已经在堆中生成了一个字符串对象 11
,所以 会将堆中的字符串对象的引用保存到字符串常量池。
这时调用 s3 == s4
,两者都指向的是堆中字符串对象 11
的首地址,所以返回值是 true
。
总结
在 JDK 6 中,当调用字符串的 intern()
时,若字符串常量池先前已创建出该字符串对象,则返回字符串常量池中该字符串对象的引用。否则,将该字符串对象添加到字符串常量池中,再返回该字符串对象的引用。
而在 JDK 7 中,当调用 intern()
时,如果字符串常量池先前已创建出该字符串对象,则返回池中的该字符串的引用。否则,若该字符串对象已经存在于 Java 堆中,则将堆中对此对象的引用添加到字符串常量池中,然后返回该引用;如果堆中不存在,则在池中创建该字符串并返回其引用。