下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

软件设计:资深架构师教你String常量池、String.itern()

作者: Java架构Monster     来源: https://www.cnblogs.com/sevencutekk/p/11528001.html点击数:831发布时间: 2020-04-13 15:56:38

标签: java语言C++java

  C++、java编程语言中的字符串。在java、C#中,String类是不可变的,对String类的任何改变,都是返回一个新的String类对象。String对象是System.Char对象的有序集合,用于表示字符串。String对象的值是该有序集合的内容,并且该值是不可变的。

  什么是常量

  用final修饰的成员变量表示常量,值一旦给定就无法改变!

  final修饰的变量有三种:静态变量、实例变量和局部变量,分别表示三种类型的常量。

  Class文件中的常量池

  在Class文件结构中,最头的4个字节用于存储魔数MagicNumber,用于确定一个文件是否能被JVM接受,再接着4个字节用于存储版本号,前2个字节存储次版本号,后2个存储主版本号,再接着是用于存放常量的常量池,由于常量的数量是不固定的,所以常量池的入口放置一个U2类型的数据(constant_pool_count)存储常量池容量计数值。

  常量池主要用于存放两大类常量:字面量(Literal)和符号引用量(SymbolicReferences),字面量相当于java语言层面常量的概念,如文本字符串,声明为final的常量值等,符号引用则属于编译原理方面的概念,包括了如下三种类型的常量:

  1类和接口的全限定名

  2字段名称和描述符

  3方法名称和描述符

  方法区中的运行时常量池

  运行时常量池是方法区的一部分。

  CLass文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

  运行时常量池相对于CLass文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是String类的intern()方法。

  常量池的好处

  常量池是为了避免频繁的创建和销毁对象而影响系统性能,其实现了对象的共享。

  例如字符串常量池,在编译阶段就把所有的字符串文字放到一个常量池中。

  (1)节省内存空间:常量池中所有相同的字符串常量被合并,只占用一个空间。

  (2)节省运行时间:比较字符串时,==比equals()快。对于两个引用变量,只用==判断引用是否相等,也就可以判断实际值是否相等。

  双等号==的含义

  基本数据类型之间应用双等号,比较的是他们的数值。

  复合数据类型(类)之间应用双等号,比较的是他们在内存中的存放地址。

  几种基本类型的包装类和常量池

  1java中基本类型的包装类的大部分都实现了常量池技术,

  即Byte,Short,Integer,Long,Character,Boolean;

  Integeri1=40;Integeri2=40;System.out.println(i1==i2);//输出TRUE

  这5种包装类默认创建了数值[-128,127]的相应类型的缓存数据,但是超出此范围仍然会去创建新的对象。

  //Integer缓存代码:publicstaticIntegervalueOf(inti){assertIntegerCache.high>=127;if(i>=IntegerCache.low&&i<=IntegerCache.high)returnIntegerCache.cache[i+(-IntegerCache.low)];returnnewInteger(i);

  }

  Integeri1=400;

  Integeri2=400;

  System.out.println(i1==i2);//输出false

  2两种浮点数类型的包装类Float,Double并没有实现常量池技术。

  Doublei1=1.2;

  Doublei2=1.2;

  System.out.println(i1==i2);//输出false

  3应用常量池的场景

  (1)Integeri1=40;Java在编译的时候会直接将代码封装成Integeri1=Integer.valueOf(40);,从而使用常量池中的对象。

  (2)Integeri1=newInteger(40);这种情况下会创建新的对象。

  Integeri1=40;

  Integeri2=newInteger(40);

  System.out.println(i1==i2);//输出false

  String.itern()的基本原理

  String.intern()是一个Native方法,底层调用C++的StringTable::intern方法,源码注释:当调用intern方法时,如果常量池中已经该字符串,则返回池中的字符串;否则将此字符串添加到常量池中,并返回字符串的引用。

  所以明面上,它有两大好处,一是重复的字符串,会用同一个引用代替;二是字符串比较,不再需要逐个字符的equals()比较,而用==对比引用是否相同即可。

  省内存效果只对长期存在的字符串有效

  String.intern()没有神奇的地方,只在字符串生成后,再去常量池里查找引用。所以字符串最初生成时所花的内存,是省不掉的。

  Strings=newString(bytes,“UTF-8”).intern();

  Strings=String.valueOf(i).intern();

  只有大量对象放在长期存在的集合里,里面是大量重复的字符串,或者对象的属性是重复的字符串时,省内存的效果才显现出来。短生命周期的字符串,GC要干的活是一样的。

  执行路径上多次的==,才能抵消常量池HasHMap查找的代价

  ==当然比equals()快得多,但常量池其实是个HashMap,依然没有神奇的地方,依然要执行HashMap的get操作,所以,一次hashCode()和至少一次的equals()已经预付了,如果hash冲突,那equals()次数更多。

  真的对性能影响甚微吗?

  在我的服务化框架测试里,把几个Header字段intern了,性能立马从七万五调到七万一QPS,原来从七万一升到七万五,曾做过多少效果甚微的优化加上一次Netty使用的优化而成,现在它掉下来倒是飞快。

  PS.七万五20%CPU这个数字,这两周的博客里都没升过了:(

  小陷阱

  来自R大的提醒,s.intern()是无效的,因为String是不变对象,Strings1=s.intern()后,这个s1才是个引用。

  ​String就是C++、java等编程语言中的字符串,用双引号引起来的几个字符.如"Abc","一天".与字符不同的是它指的是一串字符或者一类标识符。

赞(15)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程