聚集索引与非聚集索引的区别

https://zhuanlan.zhihu.com/p/113917726

Myisam引擎采用非聚集索引,索引与数据分开,叶子结点存放数据的地址。

面试常问集锦——MySQL部分数据库的隔离级别_MySQL

Innodb采用聚集索引,主键索引树的叶子结点存放真实数据,非主键索引树的叶子结点存放主键值

面试常问集锦——MySQL部分数据库的隔离级别_面试_02


索引底层的实现,为什么不选红黑树、B树等?

总结

(1)哈希表                   没法实现范围查找

(2)二叉搜索树           可以实现范围查找,但自增主键导致树退化为链表,查找效率由O(logn)变为O(n)

(3)红黑树                   利用旋转调整树的平衡性,但不是绝对平衡,因为自增主键会导致树向右倾斜。

(4)AVL树                    绝对平衡,查找效率为O(logn)。但树偏高,磁盘的IO次数还是很多。因此需要在每一层多存一点数据。

(5)B树                        结点直接存放数据,查找效率为O(h*logn),其中 h 为树高,n 为每个结点关键词的个数。

(6)B+树                     非叶子节点存放索引地址,因为每一层可以存放更多的关键词,查询效率更高。叶子节点存放真实数据且,叶子结点之间用链表连接起来,范围查找效率更高。

就拿命中索引的说吧,innodb主键是聚簇索引,采用b+树结构,非叶节点存的是主键和指向子节点的指针,叶子节点存的就是整体行数据,整体都是有序的,通过主键扫描根据树查找,最终落到叶子节点,命中然后返回。(其实更细的有mysql的一页有16kb,一页其实有多行记录,命中一页之后还要通过行记录索引通过二分找到行记录)

索引为什么能提高查询性能



数据库的隔离级别

(1)每种级别解决什么问题,还会存在什么问题

Read Uncommitted(读取未提交内容)

在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。

Read Committed(读取提交内容)

这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变。这种隔离级别 也支持所谓的不可重复读(Nonrepeatable Read),因为同一事务的其他实例在该实例处理其间可能会有新的commit,所以同一select可能返回不同结果。

Repeatable Read(可重读)

这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。

Serializable(可串行化)

这是最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。这四种隔离级别采取不同的锁类型来实现,若读取的是同一个数据的话,就容易发生问题。例如:

  • 脏读(Drity Read):某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的。
  • 不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据。
  • 幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就有几列数据是未查询出来的,如果此时插入和另外一个事务插入的数据,就会报错。


最左前缀匹配原则


最左前缀匹配原则:在检索数据时从联合索引的最左边开始匹配

创建一个(a,b)的联合索引,where条件中a=1 and b=2 或者是b=2 and a=1都会走联合索引(查询优化器会更改顺序)

为什么直接使用b=2走不到联合索引?

联合索引(a,b)的索引树:

面试常问集锦——MySQL部分数据库的隔离级别_MySQL_03

a在等值的情况下,b值才是按顺序排列的。即a在索引全局内有序,而b只在局部有序。

这是因为MySQL创建联合索引的规则是首先会对联合索引的最左边第一个字段排序,在第一个字段的排序基础上,然后在对第二个字段进行排序。所以仅仅是b=2这种查询条件没有办法利用联合索引。

为什么要建立联合索引?

  • 联合索引(a,b,c)相当于建立了(a)、(a,b)、(a,b,c)三个索引,能够减少索引文件的大小。
  • 在某些情况下,可以避免回表操作。比如select a,b,c from table where a=1 and b=1 and c=1;
  • 在开启索引下推的基础上,联合索引可以避免绝大多数的回表操作。

怎么判断执行器具体选择了联合索引哪一部分?

从explain内的key_len字段中


日志部分

undo日志和redo日志分别是干嘛的?

redo log重做日志是InnDB存储引擎层的,用来保证事务安全。在事务提交之前,每个修改操作都会记录变更后的数据,保存的是物理日志-数据,防止发生故障的时间点,有脏页未写入磁盘,在重启mysql的时候,根据redo log进行重做从而达到事务的持久性

undo log回滚日志保存了事务发生之前的数据的一个版本,可以用于回滚,同时也提供多版本并发控制下的读。