索引分类及适用范围索引分类及应用场景

转载

mob64ca1400bfa8 2024-04-06 19:19:29

文章标签 索引分类及适用范围字段数据主键 文章分类 数据仓库大数据

1、什么是索引？

索引：存储引擎用于快速找到记录的一种数据结构，默认使用B-Tree索引。索引是存储引擎层中实现。简单理解为：排好序的快速查找数据结构

索引的目的:提高数据查询的效率，优化查询性能，就像书的目录一样。

优势：提高检索效率，降低IO成本；排好序的表，降低CPU的消耗

劣势：索引实际也是一张表，该表保存了主键与索引字段，并指向实体表的记录，占用空间；降低更新表的速度（改数据表本身，也需要修改索引）；花时间研究建立最优秀的索引

索引的常见模型：哈希表、有序数组、搜索树。

InnoDB的索引模型：在InnoDB中，表都是根据主键顺序以索引的形式存放的，这种存储方式的表称为索引组织表。InnoDB使用的是B+Tree 索引模型，所以数据都是存储在B+Tree树中的。

索引分类及适用范围索引分类及应用场景_索引分类及适用范围

B-Tree索引通常意味着所有的值都是按顺序存储的，并且每一个叶子页到根的距离相同。

索引分类及适用范围索引分类及应用场景_数据_02

检索原理：

【如图】

一颗B+树，主要分为3个基本模块：磁盘块、数据项、指针。

真实的数据存在于叶子节点，非叶子节点不存储真实的数据，只存储指引搜索方向的数据项。

【查找过程】

如果要查找数据项29，那么首先会把磁盘块1由磁盘加载到内存，此时发生一次IO，在内存中用二分法查找确定29在17和35之间，锁定磁盘块1的P2指针，内存时间因为非常短（相对磁盘），可以忽略不计，通过磁盘块1的P2指针的磁盘地址把磁盘加载到内存，发生第二次IO，29在26和30之间，锁定磁盘块3的P2指针，通过指针加载磁盘块8到内存，发生第三次IO，同时内存中做二分查找找到29，结束查询，总计三次IO.

Ps:3层的B+树可以表示上百万的数据。

前提：假设一张表，有10W条数据，其中有一条数据是nickname=‘css’,查询这条数据sql：select * from table_award where nickname='css'

没有索引：mysql全表扫描及扫描10W条数据找这条数据。

有索引：建立nickname字段索引，mysql只需要扫描这条nickname='css'的数据

1.1 索引分类

索引主要包含5个部分：主索引、唯一索引、普通索引、全文索引、复合索引、单字段索引。其中主索引指主键自动的为主索引。

1.2 索引语法

建立索引：
CREATE [UNIQUE|FULLTEXT]  INDEX index_name ON tbl_name (col_name [(length)] [ASC | DESC] , …..);
ALTER TABLE table_name ADD INDEX [index_name] (index_col_name,...)

删除索引
DROP INDEX index_name ON tbl_name;
ALTER TABLE table_name DROP INDEX index_name;

查询索引：
SHOW INDEX FROM table_name;
SHOW KEYS FROM table_name;
DESC table_Name;

索引的分类、语法用文字的形式看起来已经麻木了，可以参考图文：索引分类为5个部分，索引操作语法3种（新增、删除、查询）。

索引分类及适用范围索引分类及应用场景_数据_03

索引分类及适用范围索引分类及应用场景_数据_04

1.3 使用索引

提高性能优化的索引：覆盖索引、最左前缀索引、索引下推。

覆盖索引：可以减少树的搜索次数，显著提高查询性能。

使用索引，查看匹配度，查询要使用索引最重要的条件是查询条件中需要使用索引。

MATCH (col1,col2,...) AGAINST (expr).

Ex:select match(col_name) against(‘poverty’)from news;

下列几种情况下有可能使用到索引：

1，对于创建的多列索引，只要查询条件使用了最左边的列，索引一般就会被使用。
2，对于使用like的查询，后面如果是常量并且只有%不在第一个字符，索引才可能被使用。
3，如果使用column_name is null将使用索引

下列几种情况不适合建立索引：

1，表记录太小

2，经常增删改的表

3，数据重复且分布平均的表字段

4，如果条件中有or，即使其中有条件有索引也不会使用。

5，对于多列索引，不是使用的第一部分，则不会使用索引。

6，like查询是以%开头

7，如果列类型是字符串，那一定要在条件中将数据使用引号引用起来。否则不使用索引。

8，如果mysql估计使用全表扫描要比使用索引快，则不使用索引。

下列几种情况适合添加索引：

1，主键自动建立唯一索引

2，频繁作为查询条件的字段应该建立索引

3，查询中与其他表关联的字段，外键关系建立索引

4，频繁更新的字段不适合创建索引-更新表的同时，同步更新索引

5，Where条件里用不到的字段不创建索引

6，单键/组合索引的选择问题，who？（在高并发下倾向创建组合索引）

7，查询中排序的字段，排序字段若通过索引去访问将大大提高排序速度

8，查询中统计或者分组字段

索引失效：

1、全值匹配

2、最佳左前缀法则

3、不在索引列上做任何操作

4、存储引擎不能使用索引中范围条件右边的列

5、尽量使用覆盖索引，减少select *

6、mysql在使用不等于的时候无法使用索引会导致全表索引

7、Is null,is not null也无法使用索引

8、Like以通配符开头(‘%abc...’)mysql索引失效会变成全表扫描的操作

9、字符串不加单引号索引失效少用or,用它来连接时会索引失效

1.4 查看索引的使用情况

查看索引的使用情况
show status like ‘Handler_read%’;

大家可以注意：
handler_read_key:这个值越高越好，越高表示使用索引查询到的次数。

handler_read_rnd_next:这个值越高，说明查询低效。这是因为我们前面没有加索引的时候，做过多次查询的原因.

索引分类及适用范围索引分类及应用场景_主键_05

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：unity 圆规画圆 unity3d如何制作圆环

下一篇：multiprocessing 共享内存大小共享内存大小限制

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯