MySQL-索引

本篇文章于 847 天前发表，某些内容可能已经过时，请注意甄别。

索引简介

在 MySQL 中，通常有以下两种方式访问数据库表的行数据：

顺序访问

顺序访问是在表中实行 全表扫描 ，从头到尾逐行遍历，直到在无序的行数据中找到符合条件的目标数据。顺序访问实现比较简单，但是当表中有大量数据的时候，效率非常低下。例如，在几千万条数据中查找少量的数据时，使用顺序访问方式将会遍历所有的数据，花费大量的时间，显然会影响数据库的处理性能。

索引访问

索引访问是通过遍历索引来访问表中记录行的方式。使用这种方式的前提是对表建立一个索引，在列上创建了索引之后，查找数据时可以直接根据该列上的索引找到对应记录行的位置，从而快捷地查找到数据。索引之所以快，是因为其底层采用 B+ 树，详细内容见：Mysql索引 .

索引最大的优点就是在海量数据下能够大幅提高查询速度。当然，索引也有缺点：1）索引需要占磁盘空间；2）当对表中的数据进行增加、删除和修改的时候，索引也要动态维护，这样就降低了数据的维护速度。索引可以提高查询速度，但是会影响插入记录的速度 。因为，向有索引的表中插入记录时，数据库系统会按照索引进行排序 ，这样就降低了插入记录的速度，插入大量记录时的速度影响会更加明显。这种情况下，最好的办法是先删除表中的索引，然后插入数据，插入完成后，再创建索引。

sql

mysql> SELECT * FROM stu_info;
+-------+------+------+-------+
| ID    | name | age  | score |
+-------+------+------+-------+
| 12134 | Jack |   18 |   150 |
| 12135 | Mike |   20 |   149 |
| 12136 | Dan  |   19 |   130 |
| 12137 | Xuan |   19 |   141 |
+-------+------+------+-------+
4 rows in set (0.00 sec)

mysql> SHOW INDEX FROM stu_info;
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table    | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| stu_info |          1 | ID       |            1 | ID          | A         |           1 |        4 | NULL   | YES  | BTREE      |         |
|
| stu_info |          1 | score    |            1 | score       | A         |           4 |     NULL | NULL   | YES  | BTREE      |         |
|
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
2 rows in set (0.00 sec)

mysql> EXPLAIN SELECT * FROM stu_info WHERE score=149;
+----+-------------+----------+------------+------+---------------+-------+---------+-------+------+----------+-------+
| id | select_type | table    | partitions | type | possible_keys | key   | key_len | ref   | rows | filtered | Extra |
+----+-------------+----------+------------+------+---------------+-------+---------+-------+------+----------+-------+
|  1 | SIMPLE      | stu_info | NULL       | ref  | score         | score | 5       | const |    1 |   100.00 | NULL  |
+----+-------------+----------+------------+------+---------------+-------+---------+-------+------+----------+-------+
1 row in set, 1 warning (0.00 sec)

mysql> EXPLAIN SELECT * FROM stu_info WHERE name='Jack';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | stu_info | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    4 |    25.00 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

使用 EXPLAIN 分析查询情况，使用 score 索引查找时，扫描的行数为 1；使用 name 无索引查找时，扫描的行数为 4，为全表扫描。

索引类型

按逻辑划分

普通索引 。
普通索引是 MySQL 中最基本的索引类型，它没有任何限制，唯一任务就是加快系统对数据的访问速度。普通索引允许在定义索引的列中插入重复值和空值。
sql
1
CREATE INDEX index_id ON tb_student(id);
唯一索引 。
创建唯一性索引的目的不是为了提高访问速度，而是为了避免数据出现重复 。唯一索引列的值必须唯一，允许有空值，且允许存在多个空值 。如果是组合索引，则列值的组合必须唯一。
sql
1
CREATE UNIQUE INDEX index_id ON tb_student(id);
主键索引 。
创建主键时，自动成为索引。主键索引是一种特殊的唯一索引，不允许值重复或者值为空 。创建主键索引通常使用 PRIMARY KEY 关键字，不能使用 CREATE INDEX 语句创建主键索引。
空间索引 。
空间索引主要用于地理空间数据类型 GEOMETRY，不常用。
sql
1
CREATE SPATIAL INDEX index_line ON tb_student(line);
全文索引 。
全文索引主要用来查找文本中的关键字，只能在 CHAR、VARCHAR 或 TEXT 类型的列上创建。在 MySQL 中只有 MyISAM 存储引擎支持全文索引。 实际开发中，不采用 mysql 自带的全文索引（其效率不高），而使用全文搜索框架 Solr 和 ElasticSearch。
sql
1
CREATE FULLTEXT INDEX index_info ON tb_student(info);

按实现划分

BTREE索引 。
目前大部分的索引都是采用 B-树索引来存储的。B-树索引可以进行全键值、键值范围和键值前缀查询，也可以对查询结果进行 ORDER BY 排序。但 B-树索引必须遵循左边前缀原则，要考虑以下几点约束：
- 查询必须从索引的最左边的列开始。
- 查询不能跳过某一索引列，必须按照从左到右的顺序进行匹配。
- 存储引擎不能使用索引中范围条件右边的列。
哈希索引
又叫散列索引。仅有 MEMORY 存储引擎和 HEAP 存储引擎支持这类索引。其中，MEMORY 存储引擎可以支持 B-树索引和 HASH 索引，且将 HASH 当成默认索引。哈希速度比 BTREE 更快，但缺点也很明显：
- 相对于 B-树索引来说，建立哈希索引会耗费更多的时间。
- 只支持等值比较，如 “=” ，“IN()” 或 “<=>”。
- 不能使用 HASH 索引排序
- HASH 索引不支持键的部分匹配，因为在计算 HASH 值的时候是通过整个索引值来计算的.
存储引擎 允许的索引类型

MyISAM BTREE

InnoDB BTREE

MEMORY/HEAP HASH, BTREE

存储引擎	允许的索引类型
MyISAM	BTREE
InnoDB	BTREE
MEMORY/HEAP	HASH, BTREE

按数量划分

单列索引 。
单列索引就是索引只包含原表的一个列。单列索引可以是普通索引，也可以是唯一性索引，还可以是全文索引。只要保证该索引只对应一个字段即可。
多列索引 。
也称为复合索引或组合索引。相对于单列索引来说，组合索引是将原表的多个列共同组成一个索引 。多列索引是在表的多个字段上创建一个索引。该索引指向创建时对应的多个字段，可以通过这几个字段进行查询。但是，只有查询条件中使用了这些字段中第一个字段时，索引才会被使用。 例如，在表中的 id、name 和 sex 字段上建立一个多列索引，那么，只有查询条件使用了 id 字段时，该索引才会被使用。
sql
1
CREATE INDEX index_na ON tb_student(id,name,sex);

创建索引

使用 CREATE INDEX 语句
可以使用专门用于创建索引的 CREATE INDEX 语句在一个已有的表上创建索引，但该语句不能创建主键 。

语法格式：

sql

1	CREATE <索引名> ON <表名> (<列名> [<长度>] [ ASC \| DESC])

<长度> ：可选项。指定使用列前的 length 个字符来创建索引。使用列的一部分创建索引有利于减小索引文件的大小 ，节省索引列所占的空间。在某些情况下，只能对列的前缀进行索引。索引列的长度有一个最大上限 255 个字节（MyISAM 和 InnoDB 表的最大上限为 1000 个字节），如果索引列的长度超过了这个上限，就只能用列的前缀进行索引。另外，BLOB 或 TEXT 类型的列也必须使用前缀索引 。

前缀最长为255字节。对于 MyISAM 和 InnoDB 表，前缀最长为1000字节。注意前缀的限长以字节计，而CREATE INDEX语句中的前缀长度指的是字符的数目。对于使用多字节字符集的列，在指定列的前缀长度时，要考虑这一点。
另外，当查询条件的前缀与索引前缀相同时，索引也起不到作用。如下：

sql

mysql> SELECT * FROM stu_info;
+-------+------+------+-------+
| ID    | name | age  | score |
+-------+------+------+-------+
| 12134 | Jack |   18 |   150 |
| 12135 | Mike |   20 |   149 |
| 12136 | Dan  |   19 |   130 |
| 12137 | Xuan |   19 |   141 |
| 12345 | Mike |   20 |   120 |
+-------+------+------+-------+
5 rows in set (0.00 sec)
mysql> SHOW INDEX FROM stu_info;
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table    | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| stu_info |          1 | ID       |            1 | ID          | A         |           1 |        4 | NULL   | YES  | BTREE      |         |
|
+----------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
1 row in set (0.00 sec)
mysql> EXPLAIN SELECT * FROM stu_info WHERE ID='12134';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | stu_info | NULL       | ALL  | ID            | NULL | NULL    | NULL |    5 |    80.00 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)
mysql> EXPLAIN SELECT * FROM stu_info WHERE ID='12345';
+----+-------------+----------+------------+------+---------------+------+---------+-------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref   | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+-------+------+----------+-------------+
|  1 | SIMPLE      | stu_info | NULL       | ref  | ID            | ID   | 15      | const |    1 |   100.00 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+-------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

注意，ID 索引长度为 4。

ASC|DESC ：可选项。ASC 指定索引按照升序来排列，DESC 指定索引按照降序来排列，默认为 ASC 。

目前(2005年)，ASC|DESC 关键词被分析，但是被忽略；索引值均以递增顺序存储。

sql

mysql> SELECT * FROM stu_info;
+-------+------+------+-------+
| ID    | name | age  | score |
+-------+------+------+-------+
| 12134 | Jack |   18 |   150 |
| 12135 | Mike |   20 |   149 |
| 12136 | Dan  |   19 |   130 |
| 12137 | Xuan |   19 |   141 |
+-------+------+------+-------+
4 rows in set (0.00 sec)

mysql> CREATE INDEX ID ON stu_info(ID);
Query OK, 0 rows affected (0.02 sec)
Records: 0  Duplicates: 0  Warnings: 0

使用 CREATE TABLE 语句 索引也可以在创建表（CREATE TABLE）的同时创建。在 CREATE TABLE 语句中添加以下语句。索引也可以在创建表（CREATE TABLE）的同时创建。在 CREATE TABLE 语句中添加以下语句。语法格式：

sql

###指定主键索引
PRIMARY KEY [索引类型] (<列名>,…)
###创建普通索引
KEY | INDEX [<索引名>] [<索引类型>] (<列名>,…)
###创建唯一索引
UNIQUE [ INDEX | KEY] [<索引名>] [<索引类型>] (<列名>,…)

sql

mysql> CREATE TABLE stu (
    -> ID VARCHAR(8) PRIMARY KEY,
    -> `name` VARCHAR(32));
Query OK, 0 rows affected (0.02 sec)
###################################
mysql> CREATE TABLE test (
    -> ID VARCHAR(8) ,
    -> `name` VARCHAR(32),
    -> PRIMARY KEY(ID,`name`));
Query OK, 0 rows affected (0.02 sec)
###################################
mysql> CREATE TABLE staff (
    -> `name` VARCHAR(32),
    -> `mgr`  VARCHAR(32),
    -> id     CHAR(8),
    -> UNIQUE(id));
Query OK, 0 rows affected (0.02 sec)

在使用 CREATE TABLE 语句定义列选项的时候，可以通过直接在某个列定义后面添加 PRIMARY KEY 的方式创建主键。而当主键是由多个列组成的多列索引时，则不能使用这种方法，只能用在语句的最后加上一个 PRIMARY KRY(<列名>，…) 子句的方式来实现。

使用 ALTER TABLE 语句
使用 ALTER TABLE 语句向已有的表添加索引：

sql

###添加普通索引，一般用INDEX不用KEY
ADD INDEX|KEY [<索引名>] [<索引类型>] (<列名>,…)
###添加主键
ADD PRIMARY KEY [<索引类型>] (<列名>,…)
###添加唯一索引
ADD UNIQUE [ INDEX | KEY] [<索引名>] [<索引类型>] (<列名>,…)

sql

1
2
3

mysql> ALTER TABLE stu_info ADD INDEX (score);
Query OK, 0 rows affected (0.03 sec)
Records: 0  Duplicates: 0  Warnings: 0

注意，以上创建索引时，不指定索引名则索引名同列名。 同一张表中，索引名不能重复。

查看索引

sql

1	SHOW INDEX FROM <表名>

sql

mysql> SHOW INDEX FROM no1sc.staff;
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| staff |          0 | id       |            1 | id          | A         |           0 |     NULL | NULL   | YES  | BTREE      |         |               |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
1 row in set (0.00 sec)

参数	说明
Table	表示创建索引的数据表名，这里是 tb_stu_info2 数据表。
Non_unique	表示该索引是否是唯一索引。若不是唯一索引，则该列的值为 1；若是唯一索引，则该列的值为 0。
Key_name	表示索引的名称。
Seq_in_index	表示该列在索引中的位置，如果索引是单列的，则该列的值为 1；如果索引是组合索引，则该列的值为每列在索引定义中的顺序。
Column_name	表示定义索引的列字段。
Collation	表示列以何种顺序存储在索引中。在 MySQL 中，升序显示值“A”（升序），若显示为 NULL，则表示无分类。
Cardinality	索引中唯一值数目的估计值。基数根据被存储为整数的统计数据计数，所以即使对于小型表，该值也没有必要是精确的。基数越大，当进行联合时，MySQL 使用该索引的机会就越大。
Sub_part	表示列中被编入索引的字符的数量。若列只是部分被编入索引，则该列的值为被编入索引的字符的数目；若整列被编入索引，则该列的值为 NULL。
Packed	指示关键字如何被压缩。若没有被压缩，值为 NULL。
Null	用于显示索引列中是否包含 NULL。若列含有 NULL，该列的值为 YES。若没有，则该列的值为 NO。
Index_type	显示索引使用的类型和方法（BTREE、FULLTEXT、HASH、RTREE）。
Comment	显示评注。

删除索引

sql

1	DROP INDEX <索引名> ON <表名>

sql

mysql> show index from staff;
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| staff |          0 | id       |            1 | id          | A         |           0 |     NULL | NULL   | YES  | BTREE      |         |               |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
1 row in set (0.00 sec)

mysql> DROP INDEX id ON staff;
Query OK, 0 rows affected (0.01 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> show index from staff;
Empty set (0.00 sec)

注意事项

索引在什么时候会失效

LIKE 关键字配置的字符串不能以“%”开头；
使用多列索引时，查询条件必须要使用这个索引的第一个字段；
使用 OR 关键字时，OR 关键字连接的所有条件都必须使用索引 。

提高索引效率

选择唯一性索引
唯一性索引的值是唯一的，可以更快速的通过该索引来确定某条记录。例如，学生表中学号是具有唯一性的字段。为该字段建立唯一性索引可以很快的确定某个学生的信息。如果使用姓名的话，可能存在同名现象，从而降低查询速度。
为经常需要排序、分组和联合操作的字段建立索引
经常需要 ORDER BY、GROUP BY、DISTINCT 和 UNION 等操作的字段，排序操作会浪费很多时间。如果为其建立索引，可以有效地避免排序操作。
为常作为查询条件的字段建立索引
如果某个字段经常用来做查询条件，那么该字段的查询速度会影响整个表的查询速度。因此，为这样的字段建立索引，可以提高整个表的查询速度。注意：常查询条件的字段不一定是所要选择的列，换句话说，最适合索引的列是出现在 WHERE 子句中的列，或连接子句中指定的列，而不是出现在 SELECT 关键字后的选择列表中的列。
限制索引的数目
索引的数目不是“越多越好”。每个索引都需要占用磁盘空间，索引越多，需要的磁盘空间就越大。在修改表的内容时，索引必须进行更新，有时还可能需要重构。因此，索引越多，更新表的时间就越长。如果有一个索引很少利用或从不使用，那么会不必要地减缓表的修改速度。此外，MySQL 在生成一个执行计划时，要考虑各个索引，这也要花费时间。创建多余的索引给查询优化带来了更多的工作。索引太多，也可能会使 MySQL 选择不到所要使用的最佳索引。
尽量使用数据量少的索引如果索引的值很长，那么查询的速度会受到影响。
例如，对一个 CHAR(100) 类型的字段进行全文检索需要的时间肯定要比对 CHAR(10) 类型的字段需要的时间要多。
数据量小的表最好不要使用索引
.由于数据较小，查询花费的时间可能比遍历索引的时间还要短，索引可能不会产生优化效果。
尽量使用前缀来索引
如果索引字段的值很长，最好使用值的前缀来索引。例如，TEXT 和 BLOG 类型的字段，进行全文检索会很浪费时间。如果只检索字段的前面的若干个字符，这样可以提高检索速度。
删除不再使用或者很少使用的索引
表中的数据被大量更新，或者数据的使用方式被改变后，原有的一些索引可能不再需要。应该定期找出这些索引，将它们删除，从而减少索引对更新操作的影响。