先上个例子:

s = "hello_world_yyy = val_wwww + max_zzz / 2"

for v0,v1,v2,v3 in string.gmatch(s, '%s*(%w+_[%w_]+)%s*=%s*(%w+_[%w_]+)%s+[+]+%s+(%w+_[%w_]+)%s+[/]*%s+([%w]+)%s*') do
	print(v0,v1,v2,v3)
end

与其他脚本语言不同的是,Lua 并不使用符合 POSIX 规范的正则表达式(也写作 regexp)来进行模式匹配。然而,Lua 中的模式匹配功能是很强大的,并且包含了一些标准 POSIX 模式匹配不容易实现的功能。 

用于模式匹配的模式串的构成: 

字符类 

. 任意字符        
       %a 字母        
       %c 控制字符        
       %d 数字        
      %l 小写字母        
      %p 标点字符        
      %s 空白符        
         %u 大写字母        
     %w 字母和数字        
      %x 十六进制数字        
         %z 代表0的字符

上面字符类的大写形式表示小写所代表的集合的补集。

特殊字符

( ) . % + - * ? [ ^ $

'%' 用作特殊字符的转义字符,因此 '%.' 匹配点;'%%' 匹配字符 '%'。转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。当对一个字符有疑问的时候,为安全起见请使用转义字符转义他。  

'\' 转义引号,'\' 是 Lua 的转义符。  

方括号将字符类或者字符括起来创建自己的字符类(或称之为 char-set)。比如,'[%w_]' 将匹配字母数字和下划线,'[01]' 匹配二进制数字,'[%[%]]' 匹配一对方括号。

连字符连接表示这两个字符之间范围内的字符集合。

       可以在字符集(char-set)的开始处使用 '^' 表示其补集:'[^0-7]' 匹配任何不是八进制数字的字符;'[^\n]' 匹配任何非换行符户的字符。记住,可以使用大写的字符类表示其补集:'%S' 比 '[^%s]' 要简短些。

       Lua的字符类依赖于本地环境,所以 '[a-z]' 可能与 '%l' 表示的字符集不同。

模式修饰符

+ 匹配前一字符1次或多次        
       * 匹配前一字符0次或多次        
    - 匹配前一字符0次或多次        
      ? 匹配前一字符0次或1次

'+',匹配一个或多个字符,总是进行最长的匹配。  

'*'

'-' 与 '*' 一样,都匹配一个字符的0次或多次出现,但是进行的是最短匹配。

'?'

以 '^' 开头的模式只匹配目标串的开始部分,相似的,以 '$' 结尾的模式只匹配目标串的结尾部分。这不仅可以用来限制你要查找的模式,还可以定位(anchor)模式。  

'%b' 用来匹配对称的字符。常写为 '%bxy' ,x和y是任意两个不同的字符;x作为匹配的开始,y作为匹配的结束。常用的这种模式有:'%b()' ,'%b[]','%b%{%}' 和 '%b<>'。你也可以使用任何字符作为分隔符。

============== 2013年3月9日 更新

  ==================  

Capture 机制 - 可以使用模式串的一部分匹配目标串的一部分。将你想捕获的模式用圆括号括起来,就指定了一个capture。  

例如,在string.find使用captures的时候,函数会返回捕获的值作为额外的结果。这常被用来将一个目标串拆分成多个:

pair = "name = Anna"
_, _, key, value = string.find(pair, "(%a+)%s*=%s*(%a+)")
print(key, value) --> name Anna
date = "17/7/1990"
_, _, d, m, y = string.find(date, "(%d+)/(%d+)/(%d+)")
print(d, m, y) --> 17 7 1990