概述

正则表达式和MySQL有何关系?正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用where子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤select检索出的数据。

表达式语法

基本字符匹配

基本语法如下所示:

select prod_name from products where prod_name regexp '1000'

上面的语句作用是检索列prod_name中包含文本1000的所有行。

select prod_name from products where prod_name regexp '.000'

上面的语句中的.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,1000和2000都匹配且返回。

PS:MySQL中的正则表达式匹配不区分大小写。为区分大小写,可使用BINARY关键字,如:

where prod_name regexp binary 'jetpack .000'

进行OR匹配

为搜索两个串之一,使用|,如下所示:

select prod_name from products where prod_name regexp '1000|2000|3000'

匹配几个字符之一

匹配任何单一字符。但是,如果你只想匹配特定的字符,怎么办?可通过指定一组[和]括起来的字符完成,如下所示:

select prod_name from products where prod_name regexp '[123] Ton'

匹配范围

集合可用来定义要匹配的一个或多个字符。例如,下面的集合将匹配数字0到9:

[0123456789]

为了简化这种类型的集合,可使用-来定义一个范围。下面的式子功能等同于上述数字列表:

[0-9]

范围不限于完整的集合,[1-3]和[6-9]也是合法的范围。此外,范围不一定只是数值的,[a-z]匹配任意字母字符。

匹配特殊字符

为了匹配特殊字符,必须用\\为前导。\\-表示查找-,\\.表示查找.。这种处理就是所谓的转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。这包括.、|、[]、\等。

匹配字符类

存在找出你自己使用的数字、所有字母字符或所有数字字母字符等匹配。为了更方便的工作,可以使用预定义的字符集,称为字符类。表列出了字符类以及他们的含义:

说明

[:alnum:]

任意字母和数字(同[a-zA-Z0-9])

[:alpha:]

任意字符

[:blank:]

空格和制表

[:cntrl:]

ASCII控制字符

[:digit:]

任意数字(同[0-9])

[:print:]

任意可打印字符

[:graph:]

与[:print:]相同,但不包括空格

[:lower:]

任意小写字母(同[a - z])

[:punct:]

既不在[:alnum:]又不在[:cntrl:]中任意字符

[:space:]

包括空格在内的任意空白字符

[:upper:]

任意大写字母

[:xdigt:]

任意十六进制

匹配多个实例

目前为止使用的所有正则表达式都视图匹配单词出现。如果存在一个匹配,改行被检索出来,如果不存在,检索不出任何行。但是有需要对匹配的数目进行更强的控制。例如,你可能需要寻找所有的数,不管书中包含多少个字。

这可以用正则的表达式重复元字符来完成。

元字符

说明

*

0个或多个匹配

+

一个或多个匹配

?

0个或一个匹配

{n}

n个数目的匹配

{n,}

n个以上的匹配

{n,m}

n~m个数目的匹配(m不超过255)

定位符

目前为止的所有例子都是匹配一个串中任意位置的文本。为了匹配特定位置的文本,需要使用下面给出的定位符:

元字符

说明

^

文本的开始

$

文本的结尾

[[:&lt:]]

词的开始

[[:>:]]

词的结尾