由浅入深讲解MySQL数据库索引的选择性
|
源代码网整理以下在MySQL中,对于索引的使用并是一直都采用正确的决定。 源代码网整理以下简单表的示例: 源代码网整理以下CREATE TABLE `r2` ( 源代码网整理以下ID` int(11) DEFAULT NULL, 源代码网整理以下ID1` int(11) DEFAULT NULL, 源代码网整理以下CNAME` varchar(32) DEFAULT NULL, 源代码网整理以下KEY `ID1` (`ID1`) 源代码网整理以下) ENGINE=MyISAM DEFAULT CHARSET=latin1 源代码网整理以下SELECT COUNT(*) FROM r2; 源代码网整理以下250001 (V1) 源代码网整理以下SELECT COUNT(*) FROM r2 WHERE ID1=1; 源代码网整理以下83036 (V2) 源代码网整理以下(execution time = 110 ms) 源代码网整理以下(ID1=1)条件查询索引的选择性是 V2/V1 = 0.3321 或 33.21% 源代码网整理以下一般来说(例如书 “SQL Tuning“),如果选择性超过 20% 那么全表扫描比使用索引性能更优。 源代码网整理以下我知道Oracle一直是在选择性超过25%时会选择全表扫描。 源代码网整理以下而MySQL呢: 源代码网整理以下mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1; 源代码网整理以下+----+-------------+-------+------+---------------+----- 源代码网整理以下| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra | 源代码网整理以下+----+-------------+-------+------+---------------+----- 源代码网整理以下| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE | 源代码网整理以下+----+-------------+-------+------+---------------+----- 源代码网整理以下这就是MySQL将会使用索引来完成这个查询。 源代码网整理以下让我们来对比索引查询和全表扫描的执行时间: 源代码网整理以下SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms 源代码网整理以下SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms 源代码网整理以下如你所看到全表扫描要快2倍。 源代码网整理以下参考更特殊的例子:选择性 ~95%: 源代码网整理以下SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2; 源代码网整理以下0.9492 = 94.92%; 源代码网整理以下说明MySQL将会用索引来完成查询。 源代码网整理以下执行时间: 源代码网整理以下SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms 源代码网整理以下SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms 源代码网整理以下这次全表扫描要快4.6倍。 源代码网整理以下为什么MySQL选择索引访问查询? 源代码网整理以下MySQL没有计算索引的选择性,只是预测逻辑IO操作的数量,并且我们的例子中间的逻辑IO数量,索引访问要少于全表扫描。 源代码网整理以下最后我们得出结论,对于索引要小心使用,因为它们并不能帮助所有的查询。 |
