正则表达式



正则表达式(Regular Expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串将匹配的子串替换或者从某个串中取出符合某个条件的子串

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class PatternDemo {
    /**
     * Avoid use Pattern.compile in method body.
     * @return
     */
    public static boolean isCheckPattern(String sequences) {
        //[0-9]表示范围 {6}表示出现的次数
        Pattern localPattern = Pattern.compile("[0-9]{6}");
        //验证
        Matcher matcher = localPattern.matcher(sequences);
        boolean checked = matcher.matches();
        return checked;
    }

    public static void main(String[] args) {
        String str = "123456";//true 符合
        String str1 = "12345s";//false 字符不匹配
        String str2 = "1234567";//false 长度不匹配
        System.out.println(isCheckPattern(str2));     }

}

除了这种方式验证,字符串String类自身也有是支持正则表达式的API:

String str3 = "qwerty";
        boolean checked = str3.matches("[a-y]{6}");
        System.out.println(checked);

正则表达式复杂点的写法:
这里有两个连续的[ ],可以拼接表示允许的范围,后面的{ }中的量词表示字符的范围。
比如,例子中验证qwertyuA678前7位范围是否都在a-z,后面的8-15位的范围是否都在A-z或0-9内。

String str4 = "qwertyuA678";
        boolean checked = str4.matches("[a-z][A-z0-9]{7,15}");

正则表达式还支持字符串的截取:
该例就表示字符串中的字符要是在a-z的范围内就截取

String str5 = "23e45e2e2f4";
        String[] splitStrings = str5.split("[a-z]");
        for (String s : splitStrings) {
            System.out.print(s+" "); 
        }
//        23 45 2 2 4

正则表达式还支持字符串的替换:
如该例是将字符串str6中不是01的字符都转为1

String str6 = "100sb1011d00bdf";
        String replaced = str6.replaceAll("[^01]", "1");
        System.out.println(replaced); //100111011100111

更多的正则表达式格式如下表:
方括号
方括号用于查找某个范围内的字符:

表达式

描述

[abc]

查找方括号之间的任何字符

[^abc]

查找不在方括号之间的字符

[0-9]

查找任何从0到9之间的字符

[a-z]

查找任何从a到z之间的字符

[A-Z]

查找任何从A到Z之间的字符

[a-Z]

查找任何从a到Z之间的字符

[adgk]

查找给定集合内的任何字符

[^adgk]

查找给定集合外的任何字符

[red|blue|green]

查找任何指定的选型

量词

量词

描述

n+

匹配任何包含至少一个n的字符串

n*

匹配任何包含零个或多个n的字符串

n?

匹配任何包含零个或一个n的字符串

n[X]

匹配包含X个n的序列的字符串

n[X,Y]

匹配包含X个或Y个n的序列的字符串

n[X,]

匹配包含至少X个n的序列的字符串

n$

匹配任何结尾为n的字符串

^n

匹配任何开头为n的字符串

?=n

匹配任何其后紧接指定字符串n的字符串

?!n

匹配任何其后没有紧接指定字符串n的字符串