概述
正则表达式和MySQL有何关系?正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用where子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤select检索出的数据。
表达式语法
基本字符匹配
基本语法如下所示:
select prod_name from products where prod_name regexp '1000'
上面的语句作用是检索列prod_name中包含文本1000的所有行。
select prod_name from products where prod_name regexp '.000'
上面的语句中的.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,1000和2000都匹配且返回。
PS:MySQL中的正则表达式匹配不区分大小写。为区分大小写,可使用BINARY关键字,如:
where prod_name regexp binary 'jetpack .000'
进行OR匹配
为搜索两个串之一,使用|,如下所示:
select prod_name from products where prod_name regexp '1000|2000|3000'
匹配几个字符之一
匹配任何单一字符。但是,如果你只想匹配特定的字符,怎么办?可通过指定一组[和]括起来的字符完成,如下所示:
select prod_name from products where prod_name regexp '[123] Ton'
匹配范围
集合可用来定义要匹配的一个或多个字符。例如,下面的集合将匹配数字0到9:
[0123456789]
为了简化这种类型的集合,可使用-来定义一个范围。下面的式子功能等同于上述数字列表:
[0-9]
范围不限于完整的集合,[1-3]和[6-9]也是合法的范围。此外,范围不一定只是数值的,[a-z]匹配任意字母字符。
匹配特殊字符
为了匹配特殊字符,必须用\\为前导。\\-表示查找-,\\.表示查找.。这种处理就是所谓的转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括.、|、[]、\等。
匹配字符类
存在找出你自己使用的数字、所有字母字符或所有数字字母字符等匹配。为了更方便的工作,可以使用预定义的字符集,称为字符类。表列出了字符类以及他们的含义:
类
说明
[:alnum:]
任意字母和数字(同[a-zA-Z0-9])
[:alpha:]
任意字符
[:blank:]
空格和制表
[:cntrl:]
ASCII控制字符
[:digit:]
任意数字(同[0-9])
[:print:]
任意可打印字符
[:graph:]
与[:print:]相同,但不包括空格
[:lower:]
任意小写字母(同[a - z])
[:punct:]
既不在[:alnum:]又不在[:cntrl:]中任意字符
[:space:]
包括空格在内的任意空白字符
[:upper:]
任意大写字母
[:xdigt:]
任意十六进制
匹配多个实例
目前为止使用的所有正则表达式都视图匹配单词出现。如果存在一个匹配,改行被检索出来,如果不存在,检索不出任何行。但是有需要对匹配的数目进行更强的控制。例如,你可能需要寻找所有的数,不管书中包含多少个字。
这可以用正则的表达式重复元字符来完成。
元字符
说明
*
0个或多个匹配
+
一个或多个匹配
?
0个或一个匹配
{n}
n个数目的匹配
{n,}
n个以上的匹配
{n,m}
n~m个数目的匹配(m不超过255)
定位符
目前为止的所有例子都是匹配一个串中任意位置的文本。为了匹配特定位置的文本,需要使用下面给出的定位符:
元字符
说明
^
文本的开始
$
文本的结尾
[[:<:]]
词的开始
[[:>:]]
词的结尾