正则基础:
字符集
[ ] : 代表单个字符。
[^] : 除了该字符外的所有单个字符。
[a-zA-Z] : [a-z] || [A-Z]。
[a-d[m-p]] :[a, d] || [m, p] 并集关系。
[a-z&&[def]] :交集 {“d”, “e”, “f”}。
[a-z&&[^bc]] :a-z && [^bc],a-z 除去 bc。
[a-z&&[^m-p]] :a-z 中除了 m-p。
预定义字符集
. :任意字符。
\d :[0-9] 单个数字字符。
\d 代表转义字符,如果想表示 \d 的话,需要 \d。
\D :[^0-9] 除了数字外的单个字符。
\s :[\t\n\x0B\f\r] 空白字符。
\S :[^\s] 非空白字符。
\w :[a-zA-Z_0-9] 单词字符。
下划线也属于单词字符。
\W :[^\w] 非单词字符。
数量词
X? :出现 1 次 或 1 次也没有(不能出现其他)。
X* :出现 0 次 或 更多次。
X+ :出现 1 次 或 多次,不包括 0 次。
X{n} :出现恰好 n 次。
X{n,} :出现至少 n 次。
X{n,m} :出现 [n, m] 次,包含 n 也包含 m。
分割功能
public String[] split(String regex)
概述:字符串分割方法,将给定字符串中,两端都符合正则表达式的字符串拆分出来。特别的,这个匹配的字符串不会出现在返回的字符数组中。
案例:我们有一个已知的字符串,其中包含了多个名字,并且每个名字中间都用 , 分隔,我们想要获取每个名字,此时可以借助正则表达式来完成。
\\\,
\\,
\\,
替换功能
- public String replaceAll(String regex, String replacement)
- 正则表达式替换功能。
String str1 = “I123 Love432 Sa324wyer!”; // 去掉数字
// 任意数字,使用 + 可以匹配多位数字,减少 replace 次数,提高性能。
String reget = “\\d+”;
String str2 = str1.replaceAll(reget, “”);
System.out.println(str2);
- 这里我们借助 String 中的另一个方法 replaceAll() 方法将字符串中的所有数字替换为空字符串。特别的,这里的正则表达式中使用了 + 来匹配出现 1 次或多次的数字,也就是将一组连续的数字一次替换掉,而不需要每次只替换掉一个数字,提高性能。
- java正则表达式相关类1) Pattern : 生成相关正则表达式规则引擎2)Matcher : 正则表达式解析引擎看下Pattern、Mather的使用
结果 :
【商家】
【时间】
【金额】
【URL】
Matcher 的构造函数是私有,只能通过 Pattern.matcher获取对象。
Mathcer 主要有matches、 find、lookingAt
matches 方法 需要匹配到所有字符串才返回true、否则返回false
private static void testMatches() {
String regex = "\\d+";
System.out.println(Pattern.matches(regex, "123")); // true
System.out.println(Pattern.matches(regex, "123abc123"));//false
System.out.println(Pattern.matches(regex, "123abc"));//false
}
lookingAt 方法 匹配最前面的字符串,匹配到的字符串的位置必须在最前面,才返回true、否则返回false
private static void testLookingAt() {
String str = "123aa";
String regex = "\\d+";
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(str);
System.out.println(m.lookingAt());//true
str = "aa123";
m = p.matcher(str);
System.out.println(m.lookingAt());//false
}
find 方法 匹配到字符串可以在任意位置,如果匹配到了返回true、否则返回false
private static void testFind() {
String str = "123aa";
String regex = "\\d+";
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(str);
System.out.println(m.find());//true
str = "aa123";
m = p.matcher(str);
System.out.println(m.find());//true
str = "aa";
m = p.matcher(str);
System.out.println(m.find());//false
}
常用表达式:
1、校验密码强度
●密码的强度必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-16之间
^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,16}$
2、校验中文
●字符串只能是中文
^[\\u4e00-\\u9fa5]{0,}$
3、由数字,26个英文字母或下划线组成的字符串
^\\w+$
4、校验E-Mail 地址
5、校验身份证号码
●15位:
●18位 :
6.校验日期
●“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年
7、校验金额
●金额校验,精确到2位小数
8、校验手机号
●下面是国内 13、15、18开头的手机号正则表达式
9、判断IE的版本
10、校验IP-v4地址
11、校验IP-v6地址
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:)
{1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]
{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4})
{1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4})
{1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4})
{1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4})
{1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4})
{1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4})
{0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:)
{0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.)
{3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:)
{1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.)
{3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))
13、提取URL链接
14、文件路径及扩展名校验
15、提取Color Hex Codes
16、提取网页图片
17、提取页面超链接