认识 String 类
1. 创建字符串
常见的构造 String 的方式
// 方式一
String str = "Hello Bit";
// 方式二
String str2 = new String("Hello Bit");
// 方式三
char[] array = {'a', 'b', 'c'};
String str3 = new String(array);
在官方文档上(https://docs.oracle.com/javase/8/docs/api/index.html) 我们可以看到 String 还支持很多其他的构造方式, 我们用到的时候去查就可以了.
注意事项:
- “hello” 这样的字符串字面值常量, 类型也是 String.
- String 也是引用类型. String str = “Hello”; 这样的代码内存布局如下
- 在java中没有所谓的,字符串以\0结尾!!!
由于 String 是引用类型, 因此对于以下代码
String str1 = "Hello";
String str2 = str1;
str2引用 引用 str1引用所指的对象。
那么有同学可能会说, 是不是修改 str1 , str2 也会随之变化呢?
str1 = "world";
System.out.println(str2);
// 执行结果
Hello
我们发现, “修改” str1 之后, str2 也没发生变化, 还是 hello?
事实上, str1 = “world” 这样的代码并不算 “修改” 字符串, 而是让 str1 这个引用指向了一个新的 String 对象.
2. 字符串比较相等
代码1
String str1 = "Hello";
String str2 = "Hello";
System.out.println(str1 == str2);
// 执行结果
true
看起来貌似没啥问题, 再换个代码试试, 发现情况不太妙.
代码2
String str1 = new String("Hello");
String str2 = new String("Hello");
System.out.println(str1 == str2);
// 执行结果
false
我们来分析两种创建 String 方式的差异.
代码1内存布局
我们发现, str1 和 str2 是指向同一个对象的. 此时如 “Hello” 这样的字符串常量是在 字符串常量池 中.关于字符串常量池
如 “Hello” 这样的字符串字面值常量, 也是需要一定的内存空间来存储的. 这样的常量具有一个特点, 就是不需要修改(常量嘛). 所以如果代码中有多个地方引用都需要使用 “Hello” 的话, 就直接引用到常量池的这个位置就行了, 而没必要把 “Hello” 在内存中存储两次.
代码2内存布局
通过 String str1 = new String(“Hello”); 这样的方式创建的 String 对象相当于再堆上另外开辟了空间来存储"Hello" 的内容, 也就是内存中存在两份 “Hello”.
String 使用 == 比较并不是在比较字符串内容, 而是比较两个引用是否是指向同一个对象.
Java 中要想比较字符串的内容, 必须采用String类提供的equals方法.
equals 使用注意事项
现在需要比较 str 和 “Hello” 两个字符串是否相等, 我们该如何来写呢?
String str = new String("Hello");
// 方式一
System.out.println(str.equals("Hello"));
// 方式二
System.out.println("Hello".equals(str));
在上面的代码中, 哪种方式更好呢?
我们更推荐使用 “方式二”. 一旦 str 是 null, 方式一的代码会抛出异常, 而方式二不会.
String str = null;
// 方式一
System.out.println(str.equals("Hello")); // 执行结果 抛出 java.lang.NullPointerException 异
常
// 方式二
System.out.println("Hello".equals(str)); // 执行结果 false
注意事项: “Hello” 这样的字面值常量, 本质上也是一个 String 对象, 完全可以使用 equals 等 String 对象的方法.
3. 字符串常量池
String类的两个字段注意一下:
不是说 传引用就能改变实参的值。你要看,到底这个引用干啥了!!
public static void main6(String[] args) {
String str1 = "hello";
String str2 = "he"+"llo";//此时 他两都是常量,编译的时候,就已经确定好了是"hello"
String str3 = "he";
String str4 = str3+"llo";//此时str3是一个变量-》编译的时候,不知道是啥?所以拼接的时候str4不是一个完整的"hello"对象
System.out.println(str1 == str4);
//结果为false
}
public static void main7(String[] args) {
String str1 = "11";
String str2 = new String("1")+new String("1");
System.out.println(str1 == str2);
}
//结果为false
在上面的例子中, String类的两种实例化操作, 直接赋值和 new 一个新的 String
a) 直接赋值
String str1 = "hello" ;
String str2 = "hello" ;
String str3 = "hello" ;
System.out.println(str1 == str2); // true
System.out.println(str1 == str3); // true
System.out.println(str2 == str3); // true
为什么现在并没有开辟新的堆内存空间呢?
String类的设计使用了共享设计模式
在JVM底层实际上会自动维护一个对象池(字符串常量池)
如果现在采用了直接赋值的模式进行String类的对象实例化操作,那么该实例化对象(字符串内容)将自动保存到这个对象池之中.
如果下次继续使用直接赋值的模式声明String类对象,此时对象池之中如若有指定内容,将直接进行引用
如若没有,则开辟新的字符串对象而后将其保存在对象池之中以供下次使用
b) 采用构造方法
类对象使用构造方法实例化是标准做法。分析如下程序:
String str = new String("hello") ;
我们可以使用 String 的 intern 方法来手动把 String 对象加入到字符串常量池中.
当字符串常量池 没有的时候,就会入池。如果池中已经有“11”,则入池失败。
public static void main9(String[] args) {
String str1 = "11";
String str2 = new String("1")+new String("1");
str2.intern();//手动入池-》当字符串常量池 没有的时候,就会入池。如果池中已经有“11”,则入池失败。
System.out.println(str1 == str2);
}
//结果:false
public static void main(String[] args) {
String str1 = "11";
String str2 = new String("11");
str2.intern();//手动入池-》当字符串常量池 没有的时候,就会入池。如果池中已经有“11”,则入池失败。
System.out.println(str1 == str2);
}
//结果:false
public static void main(String[] args) {
String str1 = "11";
String str2 = (new String("1")+new String("1"));
String str3 = str2.intern();
System.out.println(str1 == str3);
}
//结果:true
public static void main(String[] args) {
String str1 = "11";
String str2 = (new String("1")+new String("1")).intern();
System.out.println(str1 == str2);
}
//结果:true
public static void main(String[] args) {
String str1 = "11";
String str2 = (new String("1")+"1").intern();
System.out.println(str1 == str2);
}
//结果:true
public static void main(String[] args) {
String str2 = new String("1")+new String("1");
str2.intern();//手动入池
String str1 = "11";
System.out.println(str1 == str2);
}
//结果:true
// 该字符串常量并没有保存在对象池之中
String str1 = new String("hello") ;
String str2 = "hello" ;
System.out.println(str1 == str2);
// 执行结果
false
String str1 = new String("hello").intern() ;
String str2 = "hello" ;
System.out.println(str1 == str2);
// 执行结果
true
面试题:请解释String类中两种对象实例化的区别
- 直接赋值:只会开辟一块堆内存空间,并且该字符串对象可以自动保存在对象池中以供下次使用。
- 构造方法:会开辟两块堆内存空间,不会自动保存在对象池中,可以使用intern()方法手工入池。
综上, 我们一般采取直接赋值的方式创建 String 对象.
4. 理解字符串不可变
字符串是一种不可变对象. 它的内容不可改变.
String 类的内部实现也是基于 char[] 来实现的, 但是 String 类并没有提供 set 方法之类的来修改内部的字符数组.
public static void main121(String[] args) {
//数组的整体赋值 只有1次机会 就是在定义的时候
final int[] array = {1,2,3,4,5};
//array = new int[]{4,5,6,7};
String str1 = null;//str1这个引用 不指向任何对象
String str2 = "";//str2这个引用 指向的字符串是空的
System.out.println(str2.length());
}
感受下形如这样的代码:
String str = "hello" ;
str = str + " world" ;
str += "!!!" ;
System.out.println(str);
// 执行结果
hello world!!!
形如 += 这样的操作, 表面上好像是修改了字符串, 其实不是.
生成了5个对象
那么如果实在需要修改字符串, 例如, 现有字符串 str = “Hello” , 想改成 str = “hello” , 该怎么办?
a) 常见办法: 借助原字符串, 创建新的字符串
String str = "Hello";
str = "h" + str.substring(1);
System.out.println(str);
// 执行结果
hello
b) 特殊办法(选学): 使用 “反射” 这样的操作可以破坏封装, 访问一个类内部的 private 成员.
反射真正会用到的地方在框架
IDEA 中 ctrl + 左键 跳转到 String 类的定义, 可以看到内部包含了一个 char[] , 保存了字符串的内容.
例子:
String str = "abcde";
Class<?> c1 = String.class;
// 获取 String 类中的 value 字段. 这个 value 和 String 源码中的 value 是匹配的.
Field valueField = c1.getDeclaredField("value");
// 将这个字段的访问属性设为 true
valueField.setAccessible(true);
// 把 str 中的 value 属性获取到.
char[] value = (char[]) valueField.get(str);
// 修改 value 的值
value[0] = 'h';
System.out.println(str);
为什么 String 要不可变?(不可变对象的好处是什么?) (选学)
- 方便实现字符串对象池. 如果 String 可变, 那么对象池就需要考虑何时深拷贝字符串的问题了.
- 不可变对象是线程安全的.
- 不可变对象更方便缓存 hash code, 作为 key 时可以更高效的保存到 HashMap 中.
注意事项: 如下代码不应该在你的开发中出, 会产生大量的临时对象, 效率比较低.
(因为会产生多个对象)
String str = "hello" ;
for(int x = 0; x < 1000; x++) {
str += x ;
}
System.out.println(str);
5. 字符, 字节与字符串
5.1 字符与字符串
字符串内部包含一个字符数组,String 可以和 char[] 相互转换.
代码示例: 获取指定位置的字符
String str = "hello" ;
System.out.println(str.charAt(0)); // 下标从 0 开始
// 执行结果
h
System.out.println(str.charAt(10));
// 执行结果
产生 StringIndexOutOfBoundsException 异常
代码示例: 字符串与字符数组的转换
String str = "helloworld" ;
// 将字符串变为字符数组
char[] data = str.toCharArray() ;
for (int i = 0; i < data.length; i++) {
System.out.print(data[i]+" ");
}
// 字符数组转为字符串
System.out.println(new String(data)); // 全部转换
System.out.println(new String(data,5,5)); // 部分转换
代码示例: 给定字符串一个字符串, 判断其是否全部由数字所组成.
思路: 将字符串变为字符数组而后判断每一位字符是否是" 0 “~”‘9’"之间的内容,如果是则为数字.
注意:
可以使用boolean flg = Character.isDigit(); 来判断一个字符否为数字
可以使用boolean flg = Character.isAlphabetic(); 来判断一个字符否为字母
public static void main(String[] args) {
String str = "1a23456" ;
System.out.println(isNumber(str)? "字符串由数字所组成!" : "字符串中有非数字成员!");
}
public static boolean isNumber(String str) {
char[] data = str.toCharArray() ;
for (int i = 0; i < data.length; i++) {
//boolean flg = Character.isDigit(datda(i));
//if(flg == false) { //也可以使用Character.isDigit(datda(i))
// return false; //判断是否为数字字符
//}
if (data[i]<'0' || data[i]>'9') {
return false ;
}
}
return true ;
}
5.2 字节与字符串
字节常用于数据传输以及编码转换的处理之中,String 也能方便的和 byte[] 相互转换.
代码示例: 实现字符串与字节数组的转换处理
String str = "helloworld" ;
// String 转 byte[]
byte[] data = str.getBytes() ;
for (int i = 0; i < data.length; i++) {
System.out.print(data[i]+" ");
}
// byte[] 转 String
System.out.println(new String(data));
代码示例: 实现字符串与字节数组的转换处理(默认是UTF-8,需要抛异常)
public static void main(String[] args) throws UnsupportedEncodingException {
byte[] bytes = {97,98,99,100};
String str = new String(bytes,1,3);
System.out.println(str);
System.out.println("===============");
String str2 = "高博";
// byte[] bytes1 = str2.getBytes("GBK"); //GBK是一种编码格式
byte[] bytes1 = str2.getBytes("UTF-8");
// byte[] bytes1 = str2.getBytes();
System.out.println(Arrays.toString(bytes1));
}
5.3 小结
那么何时使用 byte[], 何时使用 char[] 呢?
- byte[] 是把 String 按照一个字节一个字节的方式处理, 这种适合在网络传输, 数据存储这样的场景下使用.更适合针对二进制数据来操作.
- char[] 是吧 String 按照一个字符一个字符的方式处理, 更适合针对文本数据来操作, 尤其是包含中文的时候.
回忆概念: 文本数据 vs 二进制数据
一个简单粗暴的区分方式就是用记事本打开能不能看懂里面的内容.
如果看的懂, 就是文本数据(例如 .java 文件), 如果看不懂, 就是二进制数据(例如 .class 文件).
6. 字符串常见操作
6.1 字符串比较
上面使用过String类提供的equals()方法,该方法本身是可以进行区分大小写的相等判断。除了这个方法之外,String类还提供有如下的比较操作:
代码示例: 不区分大小写比较
String str1 = "hello" ;
String str2 = "Hello" ;
System.out.println(str1.equals(str2)); // false
System.out.println(str1.equalsIgnoreCase(str2)); // true
在String类中compareTo()方法是一个非常重要的方法,该方法返回一个整型,该数据会根据大小关系返回三类内容:
1. 相等:返回0.
2. 小于:返回内容小于0.
3. 大于:返回内容大于0。
范例:观察compareTo()比较
System.out.println("A".compareTo("a")); // -32
System.out.println("a".compareTo("A")); // 32
System.out.println("A".compareTo("A")); // 0
System.out.println("AB".compareTo("AC")); // -1
System.out.println("刘".compareTo("杨"));
compareTo()是一个可以区分大小关系的方法,是String方法里是一个非常重要的方法。
字符串的比较大小规则, 总结成三个字 “字典序” 相当于判定两个字符串在一本词典的前面还是后面. 先比较第一个字符的大小(根据 unicode 的值来判定), 如果不分胜负, 就依次比较后面的内容
6.2 字符串查找
从一个完整的字符串之中可以判断指定内容是否存在,对于查找方法有如下定义:
代码示例: 字符串查找,最好用最方便的就是contains()
String str = "helloworld" ;
System.out.println(str.contains("world")); // true
该判断形式是从JDK1.5之后开始追加的,在JDK1.5以前要想实现与之类似的功能,就必须借助、indexOf()方法完成。
代码示例: 使用indexOf()方法进行位置查找
String str = "helloworld" ;
System.out.println(str.indexOf("world")); // 5,w开始的索引
System.out.println(str.indexOf("bit")); // -1,没有查到
if (str.indexOf("hello") != -1) {
System.out.println("可以查到指定字符串!");
}
现在基本都是用contains()方法完成。
使用indexOf()需要注意的是,如果内容重复,它只能返回查找的第一个位置
代码示例: 使用indexOf()的注意点
String str = "helloworld" ;
System.out.println(str.indexOf("l")); // 2
System.out.println(str.indexOf("l",5)); // 8
System.out.println(str.lastIndexOf("l")); // 8
在进行查找的时候往往会判断开头或结尾。
代码示例: 判断开头或结尾
String str = "**@@helloworld!!" ;
System.out.println(str.startsWith("**")); // true
System.out.println(str.startsWith("@@",2)); // ture
System.out.println(str.endsWith("!!")); // true
注意:字符串匹配一般会使用KMP算法,效率会高。
如LeetCode第28题
6.3 字符串替换
使用一个指定的新的字符串替换掉已有的字符串数据,可用的方法如下:
代码示例: 字符串的替换处理
String str = "helloworld" ;
System.out.println(str.replaceAll("l", "_"));
System.out.println(str.replaceFirst("l", "_"));
注意事项: 由于字符串是不可变对象, 替换不修改当前字符串, 而是产生一个新的字符串.
替换全部的标点符号如下:
s= s.replaceAll("\\p{Punct}", "");
6.4 字符串拆分
可以将一个完整的字符串按照指定的分隔符划分为若干个子字符串。
可用方法如下:
代码示例: 实现字符串的拆分处理
String str = "hello world hello bit" ;
String[] result = str.split(" ") ; // 按照空格拆分
for(String s: result) {
System.out.println(s);
}
代码示例: 字符串的部分拆分
String str = "hello world hello bit" ;
String[] result = str.split(" ",2) ;
for(String s: result) {
System.out.println(s);
}
//拆分成两个部分
//hello
//world hello bit
拆分是特别常用的操作. 一定要重点掌握. 另外有些特殊字符作为分割符可能无法正确切分, 需要加上转义.
代码示例: 拆分IP地址
public static void main(String[] args) {
String str = "192.168.1.1";
String[] strings = str.split("\\.",7);
for (String s:strings) {
System.out.println(s);
}
System.out.println("=================");
String str2 = "192\\168\\1\\1";
strings = str2.split("\\\\",7);
for (String s:strings) {
System.out.println(s);
}
}
//结果为:
192
168
1
1
=================
192
168
1
1
注意事项:
- 字符"|“,”*“,”+“,”." 都得加上转义字符,前面加上"\\".
- 而如果是"\\“,那么就得写成”\\\\".
- 如果一个字符串中有多个分隔符,可以用"|"作为连字符.
代码示例: 多次拆分
public static void main(String[] args) {
String str = "Java30 12&21#hello";
String[] strings = str.split(" |&|#");
for (String s:strings) {
System.out.println(s);
}
}
//结果为:
Java30
12
21
hello
String str = "name=zhangsan&age=18" ;
String[] result = str.split("&") ;
for (int i = 0; i < result.length; i++) {
String[] temp = result[i].split("=") ;
System.out.println(temp[0]+" = "+temp[1]);
}
//结果为:
name = zhangsan
age = 18
这种代码在以后的开发之中会经常出现
6.5 字符串截取
从一个完整的字符串之中截取出部分内容。可用方法如下:
代码示例: 观察字符串截取
String str = "helloworld" ;
System.out.println(str.substring(5));
System.out.println(str.substring(0, 5));
//结果为:
world
hello
注意事项:
- 索引从0开始
- 注意左闭右开区间的写法, substring(0, 5) 表示包含 0 号下标的字符, 不包含 5 号下标
- Java 中的substring(0,0)截取不到内容,substring(0,1)可以截取到第一个位置
6.6 其他操作方法
代码示例: 观察trim()方法的使用
String str = " abc defg ";
String ret = str.trim();
System.out.print(ret);
System.out.println("==============");
//结果为:
abc defg==============
trim 会去掉字符串开头和结尾的空白字符(空格, 换行, 制表符等).
代码示例: 大小写转换
String str = " hello%$$%@#$%world 哈哈哈 " ;
System.out.println(str.toUpperCase());
System.out.println(str.toLowerCase());
//结果为:
HELLO%$$%@#$%WORLD 哈哈哈
hello%$$%@#$%world 哈哈哈
这两个函数只转换字母。
代码示例: 字符串length()
String str = " hello%$$%@#$%world 哈哈哈 " ;
System.out.println(str.length());
int[] array = {1,2,3,4,5};
System.out.println(array.length);
//结果为:
24
5
注意:数组长度使用数组名称.length属性,而String中使用的是length()方法
代码示例: 观察isEmpty()方法
System.out.println("hello".isEmpty());
System.out.println("".isEmpty());
System.out.println(new String().isEmpty());
//结果为:
false
true
true
代码示例: 观察concat()方法
字符串连接,等同于"+",连接后的字符串不如池
String str = "";
String ret = str.concat("bit");
System.out.println(ret);
代码示例: 首字母大写
String类并没有提供首字母大写操作,需要自己实现.
public static void main(String[] args) {
System.out.println(fistUpper("yuisama"));
System.out.println(fistUpper(""));
System.out.println(fistUpper("a"));
}
public static String fistUpper(String str) {
if ("".equals(str)||str==null) {
return str ;
}
if (str.length()>1) {
return str.substring(0, 1).toUpperCase()+str.substring(1) ;
}
return str.toUpperCase() ;
}
//结果为:
Yuisama
A
代码示例: 字符串 格式化:String.format()
sb.append(String.format("%04d",nums[xi]));
7. StringBuffer 和 StringBuilder
首先来回顾下String类的特点:
任何的字符串常量都是String对象,而且String的常量一旦声明不可改变,如果改变对象内容,改变的是其引用的指
向而已。
通常来讲String的操作比较简单,但是由于String的不可更改特性,为了方便字符串的修改,提供StringBuffer和StringBuilder类。
StringBuffer 和 StringBuilder 大部分功能是相同的,我们课件上主要介绍 StringBuffer
7.1 append()方法
在String中使用"+"来进行字符串连接,但是这个操作StringBuffer类中需要更改为append()方法:
public synchronized StringBuffer append(各种数据类型 b)
注意:append()
方法拼接没有new
新的对象
范例:观察StringBuffer使用
public class Test{
public static void main(String[] args) {
StringBuffer sb = new StringBuffer();
sb.append("Hello").append("World");
fun(sb);
System.out.println(sb);
}
public static void fun(StringBuffer temp) {
temp.append("\n").append("www.bit.com.cn");
}
}
//结果为:
HelloWorld
www.bit.com.cn
String和StringBuffer最大的区别在于:String的内容无法修改,而StringBuffer的内容可以修改。频繁修改字符串的情况考虑使用StingBuffer。
为了更好理解String和StringBuffer,我们来看这两个类的继承结构:
可以发现两个类都是"CharSequence"接口的子类。这个接口描述的是一系列的字符集。所以字符串是字符集的子类,如果以后看见CharSequence,最简单的联想就是字符串。
注意:String和StringBuffer类不能直接转换。如果要想互相转换,可以采用如下原则:
- String变为StringBuffer:利用StringBuffer的构造方法或append()方法
public static StringBuffer func() {
String str = "abcdef";
StringBuffer sb = new StringBuffer();//使用appen()方法
sb.append(str);
return sb;
//return new StringBuffer(str); //使用构造方法
//return new StringBuilder("abcdef");
}
- StringBuffer变为String:调用toString()方法。
public static String func2() {
StringBuilder sb = new StringBuilder();
return sb.toString();
}
除了append()方法外,StringBuffer也有一些String类没有的方法:
代码示例: 字符串反转
public synchronized StringBuffer reverse()
StringBuffer sb = new StringBuffer("helloworld");
System.out.println(sb.reverse());
//结果为:
dlrowolleh
7.2 delete方法
代码示例: 删除指定范围的子字符串:
public synchronized StringBuffer delete(int start, int end)
StringBuffer sb = new StringBuffer("helloworld");
System.out.println(sb.delete(2,4));
//结果为:
heoworld
7.3 insert方法
代码示例: 观察插入操作插入数据
public synchronized StringBuffer insert(int offset, 各种数据类型 b)
StringBuffer sb = new StringBuffer("helloworld");
System.out.println(sb.insert(0, "你好"));
//结果为:
你好helloworld
面试题:请解释String、StringBuffer、StringBuilder的区别:
- String的内容不可修改,StringBuffer与StringBuilder的内容可以修改.
- StringBuffer与StringBuilder大部分功能是相似的
- StringBuffer采用同步处理,属于线程安全操作,多用于多线程;而StringBuilder未采用同步处理,属于线程不安全操作,多用于单线程。
StringBuffer要加锁解锁,保证线程安全。没有StringBuilder高效
小结
字符串操作是我们以后工作中非常常用的操作. 使用起来都非常简单方便, 一定要使用熟练.
指的注意的点:
- 字符串的比较, ==, equals, compareTo 之间的区别.
- 了解字符串常量池, 体会 “池” 的思想.
- 理解字符串不可变
- split 的应用场景
- StringBuffer 和 StringBuilder 的功能.