理解MySQL数据库覆盖索引
By admin
- One minute read - 164 words话说有这么一个表:
CREATE TABLE user_group
(
id
int(11) NOT NULL auto_increment,
uid
int(11) NOT NULL,
group_id
int(11) NOT NULL,
PRIMARY KEY (id
),
KEY uid
(uid
),
KEY group_id
(group_id
),
) ENGINE=InnoDB AUTO_INCREMENT=750366 DEFAULT CHARSET=utf8
看AUTO_INCREMENT就知道数据并不多,75万条。然后是一条简单的查询:
SELECT SQL_NO_CACHE uid FROM user_group WHERE group_id = 245;
很简单对不对?怪异的地方在于:
如果换成MyISAM做存储引擎的时候,查询耗时只需要0.01s,用InnoDB却会是0.15s左右。
如果只是就这么点差距其实不是什么大不了的事,但是真实的业务需求比这个复杂,造成的差距也很大:MyISAM只需要0.12s,InnoDB则需要2.2s.,最终定位到问题症结是在这条SQL。
Explain的结果是:
+—-+————-+————+——+—————+———-+———+——-+——+——-+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+—-+————-+————+——+—————+———-+———+——-+——+——-+
| 1 | SIMPLE | user_group | ref | group_id | group_id | 4 | const | 5544 | |
+—-+————-+————+——+—————+———-+———+——-+——+——-+
看起来已经用上索引了,而这条SQL语句已经简单到让我无法再优化了。最后请前同事Gaston诊断了一下,他认为:数据分布上,group_id相同的比较多,uid散列的比较均匀,加索引的效果一般,但是还是建议我试着加了一个多列索引:
ALTER TABLE user_group ADD INDEX group_id_uid (group_id, uid);
然后,不可思议的事情发生了……这句SQL查询的性能发生了巨大的提升,居然已经可以跑到0.00s左右了。经过优化的SQL再结合真实的业务需求,也从之前2.2s下降到0.05s。
再Explain一次:
+—-+————-+————+——+———————–+————–+———+——-+——+————-+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+—-+————-+————+——+———————–+————–+———+——-+——+————-+
| 1 | SIMPLE | user_group | ref | group_id,group_id_uid | group_id_uid | 4 | const | 5378 | Using index |
+—-+————-+————+——+———————–+————–+———+——-+——+————-+
原来是这种叫覆盖索引(covering index),MySQL只需要通过索引就可以返回查询所需要的数据,而不必在查到索引之后再去查询数据,所以那是相当的快!!但是同时也要求所查询的字段必须被索引所覆盖到,在Explain的时候,输出的Extra信息中如果有“Using Index”,就表示这条查询使用了覆盖索引。
不过,还有一个无法解释的问题就是,不用覆盖索引的情况下,为什么用MyISAM就快那么多,而InnoDB就慢这么多呢?求真相……
点击查看 使用show profiles进行调优
原文出处: http://xiaobin.net/201109/strange-sql-performance-problem/
对于第一次情况,慢的原因, 网友解释如下:
因为myisam的索引与数据是分开的,你在group_id上面建了索引的情况下,如果索引已经在keybuffer里面,则那条语句可以根据keybuffer直接定位记录在磁盘上的位置.
而innodb的数据是与主键在一起的,也就是所谓的cluster index,你在group_id上面建的实际上是secondary index,当你用group_id作为条件来查询时,实际上会先在secondary index的b-tree里面查找,先得到主键的id,然后再根据主键的id到cluster index的b-tree里面查找,找到叶子节点,也就是实际的记录,这里查找了两次b-tree,所以会慢