正则表达式

  • 使用MySQL正则表达式
  • 基本字符匹配
  • LIKE和REGEXP之间的区别
  • 进行OR匹配
  • 匹配几个字符之一
  • 匹配范围
  • 匹配特殊字符
  • 匹配字符类
  • 匹配多个实例
  • 定位符


使用MySQL正则表达式

基本字符匹配

##检索列prod_name包含文本1000的所有行
SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_MySQL

REGEXP后所跟的东西作为正则表达式处理

SELECT prod_name
FROM products
WHERE prod_name REGEXP '.000'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_正则表达式_02

LIKE和REGEXP之间的区别

SELECT prod_name
FROM products
WHERE prod_name LIKE '1000'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_git_03

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_git_04


由上面的运行结果可知,第一条语句不返回数据,第二条语句返回一行,因为LIKE匹配整个列。如果被匹配的文本在列值中出现,LIKE将不会找到它,相应的行也不被返回,(除非使用通配符)。而REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现,REGEXP将会找到它,相应的行将被返回。这是一个非常重要的差别。

注:匹配不区分大小写

进行OR匹配

为搜索两个串之一(或者为这个串,或者为另一个串),使用|,|为正则表达式的OR操作符。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000|2000'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_正则表达式_05

匹配几个字符之一

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[123] Ton'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_正则表达式_06

注:正则表达式[123] Ton,[123]定义一组字符,它的意思是匹配1或2或3,因此,1 ton和2 ton都匹配且返回(没有3 ton)。

综上:[ ]是另一种形式的OR语句,事实上,正则表达式[123]Ton为[1|2|3]Ton的缩写,也可使用后者,但是,需要用[]来定义OR语句查找什么。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '1|2|3 Ton'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_mysql正则表达式匹配纯数字_07

可以看到,这并不是我们所期望的输出,两个要求的行,还检索出了另外3行,之所以这样是由于MySQL假定你的意思是’1’或’2’或’3 ton’。除非把字符|括在一个集合中,否则它将应用于整个串。

注:在集合开始处放置一个表示否定,[123]匹配除这些字符外的任何东西。

匹配范围

集合可用来定义要匹配的一个或多个字符
[0123456789]:表示数字0-9,简化后为[0-9],[a-z]表示任意数字列表

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[1-5] Ton'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_MySQL_08

匹配特殊字符

如果要找出包含.字符的值,怎样搜索?

SELECT vend_name
FROM vendors
WHERE vend_name REGEXP '.'
ORDER BY vend_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_mysql正则表达式匹配纯数字_09


这并不是期望的输出,.匹配任意字符,因此每个行都被检索出来

注:为了匹配特殊字符,必须用\为前导。\-表示查找-,\.表示查找.

SELECT vend_name
FROM vendors
WHERE vend_name REGEXP '\\.'
ORDER BY vend_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_MySQL_10

注:这才是期望的输出。\.匹配.,所以只检索出一行。这种处理就是所谓的转义(escaping),正则表达式内具有特殊意义的所有字符都必须以这种方式转义

\也用来引用元字符(具有特殊含义的字符),如表所示:

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_正则表达式_11


*注:匹配\为了匹配反斜杠(\)字符本身,需要使用\*

匹配字符类

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_git_12

匹配多个实例

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_正则表达式_13

SELECT prod_name
FROM products
WHERE prod_name REGEXP '\\([0-9] sticks?\\)'
ORDER BY vend_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_git_14


\([0-9] sticks?\):\(匹配),[0-9]匹配任意数字(这个例子中为1和5),sticks?匹配stick和sticks(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),\)匹配)。没有?,匹配stick和sticks会非常困难。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[[:digit:]]{4}'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_mysql正则表达式匹配纯数字_15


[:digit:]匹配任意数字,因而它为数字的一个集合。{4}确切地要求它前面的字符(任意数字)出现4次,所以[[:digit:]]{4}匹配连在一起的任意4位数字。

SELECT prod_name
FROM products
WHERE prod_name REGEXP '[0-9][0-9][0-9][0-9]'
ORDER BY prod_name;

和上个语句有同样的作用

定位符

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_MySQL_16


例如,如果你想找出以一个数(包括以小数点开始的数)开始的所有产品,怎么办?简单搜索[0-9\.](或[[:digit:]\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符

SELECT prod_name
FROM products
WHERE prod_name REGEXP '^[0-9\\.]'
ORDER BY prod_name;

mysql正则表达式匹配纯数字 mysql正则表达式提取数字_mysql正则表达式匹配纯数字_17

匹配串的开始。因此,[0-9\.] 只在.或任意数字为串中第一个字符时才匹配它们。没有^,则还要多检索出4个别的行 (那些中间有数字的行)。
注:

  1. ^的双重用途 ^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。
  2. 使REGEXP起类似LIKE的作用 本章前面说过,LIKE和REGEXP的不同在于,LIKE匹配整个串而REGEXP匹配子串。利用定位符,通过用^开始每个表达式,用$结束每个表达式,可以使REGEXP的作用与LIKE一样。
  3. 简单的正则表达式测试可以在不使用数据库表的情况下用SELECT来测试正则表达式。REGEXP检查总是返回0(没有匹配)或1(匹配)。可以用带文字串的REGEXP来测试表达式,并试验它们。相应的语法如下:这个例子显然将返回0(因为文本hello中没有数字)。