正则表达式
正则表达式(Regular Expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PatternDemo {
/**
* Avoid use Pattern.compile in method body.
* @return
*/
public static boolean isCheckPattern(String sequences) {
//[0-9]表示范围 {6}表示出现的次数
Pattern localPattern = Pattern.compile("[0-9]{6}");
//验证
Matcher matcher = localPattern.matcher(sequences);
boolean checked = matcher.matches();
return checked;
}
public static void main(String[] args) {
String str = "123456";//true 符合
String str1 = "12345s";//false 字符不匹配
String str2 = "1234567";//false 长度不匹配
System.out.println(isCheckPattern(str2)); }
}
除了这种方式验证,字符串String类自身也有是支持正则表达式的API:
String str3 = "qwerty";
boolean checked = str3.matches("[a-y]{6}");
System.out.println(checked);
正则表达式复杂点的写法:
这里有两个连续的[ ],可以拼接表示允许的范围,后面的{ }中的量词表示字符的范围。
比如,例子中验证qwertyuA678
前7位范围是否都在a-z,后面的8-15位的范围是否都在A-z或0-9内。
String str4 = "qwertyuA678";
boolean checked = str4.matches("[a-z][A-z0-9]{7,15}");
正则表达式还支持字符串的截取:
该例就表示字符串中的字符要是在a-z的范围内就截取
String str5 = "23e45e2e2f4";
String[] splitStrings = str5.split("[a-z]");
for (String s : splitStrings) {
System.out.print(s+" ");
}
// 23 45 2 2 4
正则表达式还支持字符串的替换:
如该例是将字符串str6中不是01的字符都转为1
String str6 = "100sb1011d00bdf";
String replaced = str6.replaceAll("[^01]", "1");
System.out.println(replaced); //100111011100111
更多的正则表达式格式如下表:
方括号
方括号用于查找某个范围内的字符:
表达式 | 描述 |
[abc] | 查找方括号之间的任何字符 |
[^abc] | 查找不在方括号之间的字符 |
[0-9] | 查找任何从0到9之间的字符 |
[a-z] | 查找任何从a到z之间的字符 |
[A-Z] | 查找任何从A到Z之间的字符 |
[a-Z] | 查找任何从a到Z之间的字符 |
[adgk] | 查找给定集合内的任何字符 |
[^adgk] | 查找给定集合外的任何字符 |
[red|blue|green] | 查找任何指定的选型 |
量词
量词 | 描述 |
n+ | 匹配任何包含至少一个n的字符串 |
n* | 匹配任何包含零个或多个n的字符串 |
n? | 匹配任何包含零个或一个n的字符串 |
n[X] | 匹配包含X个n的序列的字符串 |
n[X,Y] | 匹配包含X个或Y个n的序列的字符串 |
n[X,] | 匹配包含至少X个n的序列的字符串 |
n$ | 匹配任何结尾为n的字符串 |
^n | 匹配任何开头为n的字符串 |
?=n | 匹配任何其后紧接指定字符串n的字符串 |
?!n | 匹配任何其后没有紧接指定字符串n的字符串 |