索引结构——B+树
回表查询
InnoDB 引擎中使用的是聚簇索引,其主索引的实现树中的叶子结点存储的是完整的数据记录,而辅助索引中存储的则只是辅助键和主键的值。
索引覆盖
如果索引已经包含了所有满足查询需要的数据,这时我们称之为覆盖索引(Covering Index),这时就不再需要回表操作。
最左匹配
一个查询可以只使用索引中的一部分,更准确地说是最左侧部分(最左优先),这就是传说中的最左匹配原则。
即最左优先,如:
- 如果有一个 2 列的索引 (col1,col2),则相当于已经对 (col1)、(col1,col2) 上建立了索引;
- 如果有一个 3 列索引 (col1,col2,col3),则相当于已经对 (col1)、(col1,col2)、(col1,col2,col3) 上建立了索引;但是 (col2,col3) 上并没有。
索引下推
对索引中包含的字段先做判断,过滤掉不符合条件的记录,减少回表字数。
建立索引原则
- 原文链接
- 最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到范围查询(
>、<、between、like
)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4
如果建立(a,b,c,d
)顺序的索引,d是用不到索引的,如果建立(a,b,d,c
)的索引则都可以用到,a,b,d
的顺序可以任意调整。 =
和in
可以乱序,比如a = 1 and b = 2 and c = 3
建立(a,b,c
)索引可以任意顺序,mysql
的查询优化器会帮你优化成索引可以识别的形式。- 尽量选择区分度高的列作为索引,区分度的公式是
count(distinct col)/count(*)
,表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键
的区分度是1,而一些状态、性别
字段可能在大数据面前区分度就是0; - 索引列不能参与计算,保持列
干净
,比如from_unixtime(create_time) = ’2014-05-29’
就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’)
- 尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可。