#【【正则】】
=begin
sub 和 gsub 及它们的替代变量 sub! 和 gsub! 是使用正则表达式时重要的字符串方法。
所有这些方法都是使用正则表达式模式执行搜索与替换操作。sub 和 sub! 替换模式的第一次出现,gsub 和 gsub! 替换模式的所有出现。
sub 和 gsub 返回一个新的字符串,保持原始的字符串不被修改,而 sub! 和 gsub! 则会修改它们调用的字符串。
=end
#例子
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##"
phone1 = phone.sub(/#.*$/,"")
puts "电话号码:#{phone}"
puts "电话号码:#{phone1}"
=begin
电话号码:156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##
电话号码:156-1835-7999
=end
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##"
phone1 = phone.sub!(/['a'-'c'].*$/,"")
puts "电话号码:#{phone}"
puts "电话号码:#{phone1}"
=begin
电话号码:156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##
电话号码:
=end
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##"
phone = phone.sub!(/#.*$/,"")
puts "电话号码:#{phone}" #电话号码:156-1835-7999
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; ##这次是真的 ##"
phone = phone.gsub!(/#.*/,"")
puts "电话号码:#{phone}" #电话号码:156-1835-7999
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; ##这次是真的 ##"
phone = phone.gsub!(/#.*$/,"")
puts "电话号码:#{phone}" #电话号码:156-1835-7999
# 移除除数字以外的其他字符
phone = "156-1835-7999 #这是一个电话号码; #这真是一个电话号码; 这次是真的 ##"
phone = phone.gsub!(/\D/,"")
puts "电话号码:#{phone}" #电话号码:15618357999
# 知识点:
先推荐一个在线的Ruby正则表达式编辑器http://www.rubular.com/
image
Ruby的正则表达式以"//"作为构造方法。表达式返回一个RegExp的对象。
image
一般规则:
/a/匹配字符a。
/\?/匹配特殊字符?。特殊字符包括^, $, ? , ., /, \, [, ], {, }, (, ), +, *.
.匹配任意字符,例如/a./匹配ab和ac。
/[ab]c/匹配ac和bc,[]之间代表范围。例如:/[a-z]/ , /[a-zA-Z0-9]/。
/[^a-zA-Z0-9]/匹配不在该范围内的字符串。
/[\d]/代表任意数字
/[\w]/代表任意字母,数字或者_
/[\s]/代表空白字符,包括空格,TAB和换行。
/[\D]/,/[\W]/,/[\S]/均为上述的否定情况。
高级规则:
?代表0或1个字符。/Mrs?\.?/匹配"Mr","Mrs","Mr.","Mrs."。
*代表0或多个字符。/Hello*/匹配"Hello","HelloJack"。
+代表1或多个字符。/a+c/匹配:"abc","abbdrec"等等。
/d{3}/匹配3个数字。
/d{1,10}/匹配1-10个数字。
/d{3,}/匹配3个数字以上。
/([A-Z]\d){5}/匹配首位是大写字母,后面4个是数字的字符串。
下图匹配的是:M后面是字符r, 后面是0或1个字符s, 在后面是0或1个字符"." , 匹配Mr、Mrs、Mr.、Mrs.
image
下面可以匹配, ,,< /p>.
image
正则表达式操作
String和RegExp均支持=~和match 2个查询匹配方法
image
可以看出,如果能够匹配,=~返回匹配的字符串位置,而match返回一个MatchData对象。如果不匹配返回nil。
MatchData可以取出其中符合各个子匹配的内容。看下面的例子:
image
m[0]返回匹配主表达式的字符串
下面的方法是等同的:
m[n] == m.captures[n]
Ruby也自动的为我们填写了一些全局变量,它们以数字做名: $1,$2,等等,$1包含的是正则表达式中从左侧开始的第一对小括号内的子模式所匹配的字符串
我们看出匹配时,是从外到内,从左到右的顺序
其它的一些方法
image