索引长度与区分度，以及crc32的应用

原创

梁十八 2019-04-08 18:40:42 博主文章分类：mysql优化 ©著作权

文章标签 索引长度与区分度 文章分类 MySQL 数据库

©著作权归作者所有：来自51CTO博客作者梁十八的原创作品，请联系作者获取转载授权，否则将追究法律责任

理想的索引

1:查询频繁 2:区分度高 3:长度小 4: 尽量能覆盖常用查询字段.

（其中2和3有矛盾）

1: 索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).

针对列中的值,从左往右截取部分,来建索引

1: 截的越短, 重复度越高,区分度越小, 索引效果越不好

2: 截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--增删改变慢,并间影响查询速度.

所以, 我们要在区分度 + 长度两者上,取得一个平衡.

惯用手法: 截取不同长度,并测试其区分度,

对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.

2:对于左前缀不易区分的列 ,建立索引的技巧

如 url列

http://www.baidu.com

http://www.google.com

列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决

1: 把列内容倒过来存储,并建立索引

Moc.udiab.www//:ptth

Ti.euxiz.www//://ptth

这样左前缀区分度大,

（这种可以在语言层面倒序和顺序操作，比如php、go。当然，如果放到客户端js则更省资源，以节约mysql性能）

2: 伪hash索引效果（用crc32函数来构造伪哈希列：把字符串的列，转成整型，来降低索引的长度）

同时存 url_hash列

（这种可以在语言层面倒序和顺序操作，比如php、go。当然，如果放到客户端js则更省资源，以节约mysql性能）

例子：

索引长度与区分度，以及crc32的应用_索引长度与区分度

传统的查询方式：

索引长度与区分度，以及crc32的应用_索引长度与区分度_02

其索引长度达到50：

索引长度与区分度，以及crc32的应用_索引长度与区分度_03

而crc32则是：

索引长度与区分度，以及crc32的应用_索引长度与区分度_04

（crc32可以在语言层面倒序和顺序操作，比如php、go。当然，如果放到客户端js则更省资源，以节约mysql性能）

crc32的索引长度：

索引长度与区分度，以及crc32的应用_索引长度与区分度_05

word最长长度是14个字（如果索引长度为14，区分度相当高。但若很多的长度只有一两个字，很多空间就浪费了。所以要在长度和区分度中做个平衡）：

索引长度与区分度，以及crc32的应用_索引长度与区分度_06

如果取长度1，且不相同的条数：

索引长度与区分度，以及crc32的应用_索引长度与区分度_07

而总共有数据条数：

索引长度与区分度，以及crc32的应用_索引长度与区分度_08

其区分度为：

索引长度与区分度，以及crc32的应用_索引长度与区分度_09

截不同长度对应的区分度：

索引长度与区分度，以及crc32的应用_索引长度与区分度_10

生成图表：

索引长度与区分度，以及crc32的应用_索引长度与区分度_11

这个案例中，如果设置长度为4，长度和区分度可以接受

建索引指定长度：

索引长度与区分度，以及crc32的应用_索引长度与区分度_12

上一篇：索引排序慢的案例分析（聚簇索引）

下一篇：大数据量分页优化

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯