regexp导致的索引失效怎么避免 regexp_extract怎么用

转载

西门吹雪 2024-07-27 11:25:28

文章标签 regexp导致的索引失效怎么避免正则表达式版本信息 iphone 文章分类 数据仓库大数据

网址1：http://blog.sina.com.cn/s/blog_a18b33080102wsdw.html

网址3：http://www.bkjia.com/yjs/858911.html

网址4：http://superlxw1234.iteye.com/blog/1751216

网址6：http://blog.sina.com.cn/s/blog_6ff05a2c0100voxd.html

网址7：http://www.178linux.com/768

函数描述:

regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp

字符串正则表达式解析函数。

-- 这个函数有点类似于 substring(str from 'regexp') ..

参数解释:

其中：

str是被解析的字符串

regexp 是正则表达式

idx是返回结果取表达式的哪一部分默认值为1。

0表示把整个正则表达式对应的结果全部返回

1表示返回正则表达式中第一个() 对应的结果以此类推

注意点：

要注意的是idx的数字不能大于表达式中()的个数。

iPhone手机版本信息大于9.2.1的信息提取出来，提取之后的结果为user_agent_new字段，如下：

正则表达式提取iPhone手机版本信息大于9.2.1的效果

上图的提取规则是：

含有iPhone（P可以是大写或小写）；

iphone后为OS或iOS;

OS后为版本信息，有三个数字组成，中间可以用_或者.链接，且版本信息大于等于.2.1；

下面来看一下正则表达式的写法：

select  city_code,imsi,imei,user_agent ,
          REGEXP_EXTRACT(user_agent, '((iPhone|iphone).*[OS].(9|1[0-9])[_|\.][2-9]{1}                                           [_|\.][1-9]{1})',0)  user_agent_new
   from  DW_DM_LTE_USER_AGENT

将每一项提取规则进行分解如下：

含有iPhone（P可以是大写或小写）：

(iPhone|iphone)

iphone后为OS或iOS：

.是另一个元字符，匹配除了换行符以外的任意字符。*同样是元字符，不过它代表的不是字符，也不是位置，而是数量——它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配。因此，.*连在一起就意味着任意数量的不包含换行的字符。

OS后为版本信息，有三个数字组成，中间可以用_或者.链接，且版本信息大于等于9.2.1：

(9|1[0-9])：第一位数字版本信息大于等于9，|代表的含义是或，[0-9]代表0-9之间的任何一位数据，1[0-9]代表大于等于10的版本

[_|\.]：中间可以用_或者.链接

[2-9]{1} ：版本的第二位数字，2-9之间的任何一位数据

[_|\.]：中间可以用_或者.链接

[1-9]{1})：版本的第三位位数字，1-9之间的任何一位数据

所以最终的正则表达式结果就是：

(iPhone|iphone).*[OS].(9|1[0-9])[_|\.][2-9]{1} [_|\.][1-9]{1}

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：查看gpu被那些pod占用查看gpu占用程序

下一篇：vue es5 获取环境变量 vue的环境变量

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

regexp导致的索引失效怎么避免 regexp_extract怎么用

regexp导致的索引失效怎么避免 regexp_extract怎么用

51CTO博客