mysql根据前缀分组求和 mysql 前缀匹配

转载

墨色天香 2023-09-29 21:22:40

文章标签 mysql根据前缀分组求和 mysql 前缀 bc 字符串性能提升 文章分类 MySQL 数据库

我有一个带代码的表和另一个带前缀的表.我需要匹配每个代码的(最长)前缀.

还有一个辅助范围,我必须限制前缀(这涉及引入其他表).我不认为这在大多数情况下都很重要,但这里是一个简化的(规范化的)方案(我必须设置item.prefix_id)：

group (id)
subgroup (id,group_id)
prefix (id,subgroup_id,prefix)
item (id,group_id,code,prefix_id)

可以在新字段中缓存前缀的长度并对其进行索引.将group_id缓存在前缀表中是可以的(尽管组是相当小的表,在大多数情况下我认为不会获得任何性能提升). item表包含几十万条记录,前缀最多包含500条.

编辑：

对不起如果问题定义不够.当使用单词“prefix”时,我实际上是指它,所以代码必须以实际前缀开头.

subgroup

id group_id

-------------

1 1

2 1

3 1

4 2

prefix

id subgroup_id prefix

------------------------

1 1 a

2 2 abc

3 2 123

4 4 abcdef

item

id group_id code prefix_id

-----------------------------------

1 1 abc123 NULL

2 1 abcdef NULL

3 1 a123 NULL

4 2 abc123 NULL

前缀列的预期结果是(item.id,item.prefix_id)：

(1,2)因为：子组1,2,3在组1下,代码abc123以前缀a开头,前缀abc和abc是两者的最大值,所以我们取ab的id为2并将其放入item.prefix_id.

(2,2)因为：即使前缀{4}(即abcdef)是最喜欢的匹配前缀,它的子组(也就是4)在组2下,但是项目在组1下,所以我们可以从子组中选择1,3和仍然是abc是三个可能的前缀中的最强匹配.

(3,1)因为：a是最热门的匹配.

(4,NULL)因为：第4项在第2组下,第2组下唯一的前缀是abcdef,这与abc123不匹配(因为abc123不以abcdef开头).

但正如我所说,整个摸索的事情并不是问题的重要组成部分.我主要关注的是将一个带有可能前缀的表与一个字符串表进行匹配,以及如何以最佳方式进行匹配. (最好意味着可读性,可维护性和性能之间的最佳权衡 – 因此标题中的“最佳预告”).

目前我做的事情如下：

UPDATE item USE INDEX (code3)
LEFT JOIN prefix ON prefix.length=3 AND LEFT(item.code,3)=prefix.prefix
LEFT JOIN subgroup ON subgroup.id=prefix.subgroup_id
WHERE subgroup.group_id == item.group_id AND
item.segment_id IS NULL

其中code3是KEY code3(segment_id,code(3)). – 同样的逻辑以1,3和4作为长度重复.它似乎非常有效,但我不喜欢它中存在重复(单个操作的4个查询). – 当然这是前缀的最大长度为4的情况.

感谢大家分享您的想法.

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：hive中 in 和 join hive join和left join区别

下一篇：spring boot dao层扫描 springboot扫描configuration

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

mysql根据前缀分组求和 mysql 前缀匹配

mysql根据前缀分组求和 mysql 前缀匹配

51CTO博客