一 :String变量保存位置
二 :String变量不可变
三:String.intern()方法
四:String 使用乱码解决
五:String 和其他数据类型之间转化
六:String 和String数组 和Char数组和byte数组的关系
七:String 在Json中的用法
八:常用的拼接字符串方式
九:String常用方法
正文
String是Java开发中最最常见的,本篇博客针对String的原理和常用的方法,以及String的在开发中常见问题做一个整体性的概括整理.因为之前对String的特性做过一些分析,所以不在详细描述,以分条的形式总体记录。
一 :String变量保存位置Java JVM实现中采用 用永久代保存字符串常量池,字符串常量池中实际上保存的是 String对象引用,字面量形式定义的字符串 (String s1 = "hehe") 会先判断字符串是否已存在。
但是 如果是变量的形式 或者是 new得到的,会保存到堆中 。
s1 s2 都是放在常量池 。s4 s5 都是运行时才可以得到值,是存在堆中的。
String s1 = "haha"; String s2 = "haha"; System.out.println(s1 == s2);//true String s3 = "ha"; String s4 = s3+"ha"; System.out.println(s1 == s4); //false String s5 = new String("haha"); System.out.println(s5 == s1);//false
二 :String变量不可变从JVM角度看,String因为用途广,为提高效率,每次都先去常量池中判断String是否存在,如果存在就复用该对象。不存在时再去添加,达到共享String,提高效率的目的。
三:String.intern()方法官网描述: 当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(用 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并返回此 String 对象的引用
四:String 使用乱码解决因为编码差异,经常会出现中文字符串乱码的问题。这是需要对String添加编码的控制
String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示
String的getBytes()方法是得到一个字串的字节数组,这是众所周知的。但特别要注意的是,本方法将返回该操作系统默认的编码格式的字节数组
而与getBytes相对的,可以通过new String(byte[], decode)的方式来还原这个“中”字时,这个new String(byte[], decode)实际是使用decode指定的编码来将byte[]解析成字符串
public static void main(String[] args) throws UnsupportedEncodingException { String s1 = "测试乱码问题"; String s2 = new String(s1.getBytes("GBK"),"GBK"); System.out.println(s2); }
五:String 和其他数据类型之间转化整数转为String ,可以通过 “重载过的+运算符 ” 实现,或者是 “调用Integer.toString()”,或者是“直接用String.valueOf(int)”
String 转为Integer Integer.parseInt(String) 或者 Integer.valueOf(s1)
一定注意 “可能会抛出转换异常”
Integer i1 = 123; // String s1 = ""+i1; String s1 = Integer.toString(i1); System.out.println(s1 instanceof String);//true System.out.println(s1.equals("123"));//true
备注 : 结合第一条说的 利用+ 将int转为String 会产生两个String对象 ,所以推荐用Integer.toString()
六:String 和String数组 和Char数组和byte数组的关系1:String 和 cahr[]数组 : 唯一的关联大概就是 String 实际上采用 char数组保存 ,下面是 我反编译String的源码。
其次String 和char的区别就是 char只保存单个字符,String保存的是多个字符
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** The value is used for character storage. */ private final char value[]; ....
2:String 和byte[]数组
主要解决中文乱码问题
3: byte 和char (可以参考 “char与byte的区别” )
byte是字节数据类型、有符号型的、占1个字节、大小范围为-128——127
char是字符数据类型、无符号型的、占2个字节(unicode码)、大小范围为0-65535
所以 :
char 不可以表示负数,byte是有符号型的,可以表示-128—127 的数