如何分析一條sql的效能-mysql知識-PHP中文網

首頁

每日程式設計

mysql知識

如何分析一條sql的效能

步履不停

Jun 18, 2019 pm 03:03 PM

sql效能

如何分析一條sql的效能

這篇文章將為大家介紹如何使用 explain 來分析一則 sql 。

網路上其實已經有非常多的文章都很詳細的介紹了explain 的使用，這篇文章將實例和原理結合起來，盡量讓你有更好的理解，相信我，認真看完你應該會有特別的收穫。

explain 翻譯過來就是解釋的意思，在 mysql 裡被稱作執行計劃，即可以透過該命令看出 mysql 在經過優化器分析後決定要如何執行該條 sql 。

說到優化器，再多說一句，mysql 內建了一個強大的優化器，優化器的主要任務就是把你寫的sql 再給優化一下，盡可能以更低成本去執行，例如掃描更少的行數，避免排序等。執行一則sql語句都經歷了什麼？我在前面的文章有介紹過優化器相關的。

你可能會問，通常在什麼時候會要用explain 呢，大多數情況下都是從mysql 的慢查詢日誌中揪出來一些查詢效率比較慢的sql 來使用explain 分析，也有的是就是在對mysql 進行最佳化的時候，例如添加索引，透過explain 來分析添加的索引能否被命中，還有的就是在業務開發的時候，在滿足需求的情況下，你可能需要透過explain 來選擇一個更高效的sql。

那麼 explain 該怎麼用呢，很簡單，直接在 sql 前面加上 explain 就行了，如下圖所示。

mysql> explain select * from t;
+----+-------------+-------+------+---------------+------+---------+------+--------+-------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows   | Extra |
+----+-------------+-------+------+---------------+------+---------+------+--------+-------+
|  1 | SIMPLE      | t     | ALL  | NULL          | NULL | NULL    | NULL | 100332 | NULL  |
+----+-------------+-------+------+---------------+------+---------+------+--------+-------+
1 row in set (0.04 sec)

可以看到，explain 會返回約10 個字段，不同版本返回的字段有些許差異，每個字段都代表著具體的意義，這篇文章我不打算把每個字段都詳細的介紹一遍，東西比較多，怕你也不容易記住，不如先把幾個重要的字段好好理解了。

其中 type、key、rows、Extra 這幾個欄位我認為是比較重要的，我們接下來透過具體的實例來幫你更好的理解這幾個欄位的意義。

首先有必要簡單介紹下這幾個欄位的字面意思。

type 表示mysql 存取資料的方式，常見的有全表掃描（all）、遍歷索引（index）、區間查詢（range）、常數或等值查詢（ref、eq_ref）、主鍵等值查詢（const）、當表中只有一筆記錄時（system）。以下是效率從最好到最差的一個排序。

system > const > eq_ref > ref > range > index > all

key 表示查詢程序實際上會用到的索引名稱。

rows 表示查詢過程中可能需要掃描的行數，這個資料不一定準確，是mysql 抽樣統計的一個資料。

Extra 表示一些額外的信息，通常會顯示是否使用了索引，是否需要排序，是否會用到臨時表等。

好了，接下來就正式開始實例分析。

還是沿用前面文章中創建的存儲引擎創建一個測試表，我們在這裡插入10 w 條測試數據，表結構如下：

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

然後看下面這條查詢語句，注意這個表目前只有一個主鍵索引，還沒有建立普通索引。

mysql> alter table t add index a_index(a);
Query OK, 0 rows affected (0.19 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> alter table t add index b_index(b);
Query OK, 0 rows affected (0.20 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> show index from t;
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| t     |          0 | PRIMARY  |            1 | id          | A         |      100332 |     NULL | NULL   |      | BTREE      |         |               |
| t     |          1 | a_index  |            1 | a           | A         |      100332 |     NULL | NULL   | YES  | BTREE      |         |               |
| t     |          1 | b_index  |            1 | b           | A         |      100332 |     NULL | NULL   | YES  | BTREE      |         |               |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
3 rows in set (0.00 sec)

其中type 值為ALL，表示全表掃描了，大家注意看到rows 這個字段顯示有100332 條，實際上我們一共才10w 條數據，所以這個字段只是mysql 的一個預估，並不一定準確。這種全表掃描的效率非常低，是需要重點被最佳化的。

接下來我們分別為欄位 a 和 b 新增普通索引，然後再看下方新增索引後的幾個 sql 。

mysql> alter table t add index a_index(a);
Query OK, 0 rows affected (0.19 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> alter table t add index b_index(b);
Query OK, 0 rows affected (0.20 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> show index from t;
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| t     |          0 | PRIMARY  |            1 | id          | A         |      100332 |     NULL | NULL   |      | BTREE      |         |               |
| t     |          1 | a_index  |            1 | a           | A         |      100332 |     NULL | NULL   | YES  | BTREE      |         |               |
| t     |          1 | b_index  |            1 | b           | A         |      100332 |     NULL | NULL   | YES  | BTREE      |         |               |
+-------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
3 rows in set (0.00 sec)

mysql> explain select * from t where a > 1000;
+----+-------------+-------+------+---------------+------+---------+------+--------+-------------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows   | Extra       |
+----+-------------+-------+------+---------------+------+---------+------+--------+-------------+
|  1 | SIMPLE      | t     | ALL  | a_index       | NULL | NULL    | NULL | 100332 | Using where |
+----+-------------+-------+------+---------------+------+---------+------+--------+-------------+
1 row in set (0.00 sec)

上面這條sql 看起來是不是有點懷疑呢，type 竟然顯示剛剛不是給字段a 添加索引了麼，而且possible_keys 也顯示了有a_index 可用，但是key 顯示null，表示mysql 實際上並不會使用a 索引，這是為啥？

這裡是因為select * 的話還需要回到主鍵索引上查找b 字段，這個過程叫回表，這條語句會篩選出9w 條滿足條件的數據，也就是說這9w 條數據都需要回表操作，全表掃描都才10w 條數據，所以在mysql 的優化器看來還不如直接全表掃描得了，至少還免去了回表過程了。

當然也不是說只要有回表運算就不會命中索引，用不用索引關鍵還在於 mysql 認為哪種查詢代價更低，我們把上面的 sql 中 where 條件再稍微改造一下。

mysql> explain select * from t where a > 99000;
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------------------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | Extra                 |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------------------+
|  1 | SIMPLE      | t     | range | a_index       | a_index | 5       | NULL |  999 | Using index condition |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------------------+
1 row in set (0.00 sec)

這回type 值為range 了，key 為a_index ，表示命中了a 索引，是一個不錯的選擇，是因為滿足這條sql 條件的只有1000 條數據，mysql 認為1000 條數據就算回表也要比全表掃描的代價低，所以說mysql 其實是個很聰明的傢伙。

我們還可以看到 Extra 欄位中值為 Using index condition，這個意思是指用到了索引，但是需要回表，再看下面這個語句。

mysql> explain select a from t where a > 99000;
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | Extra                    |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
|  1 | SIMPLE      | t     | range | a_index       | a_index | 5       | NULL |  999 | Using where; Using index |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
1 row in set (0.00 sec)

这个 Extra 中的值为 Using where; Using index ，表示查询用到了索引，且要查询的字段在索引中就能拿到，不需要回表，显然这种效率比上面的要高，所以不要轻易写 select * ，只查询业务需要的字段即可，这样可以尽可能避免回表。

再来看一个需要排序的。

mysql> explain select a from t where a > 99000 order by b;
+----+-------------+-------+-------+---------------+---------+---------+------+------+---------------------------------------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | Extra                                 |
+----+-------------+-------+-------+---------------+---------+---------+------+------+---------------------------------------+
|  1 | SIMPLE      | t     | range | a_index       | a_index | 5       | NULL |  999 | Using index condition; Using filesort |
+----+-------------+-------+-------+---------------+---------+---------+------+------+---------------------------------------+
1 row in set (0.00 sec)

这个 Extra 中返回了一个 Using filesort，意味着需要排序，这种是需要重点优化的的，也就是说查到数据后，还需要 mysql 在内存中对其进行排序，你要知道索引本身就是有序的，所以一般来讲要尽量利用索引的有序性，比如像下面这样写。

mysql> explain select a from t where a > 99990 order by a;
+----+-------------+-------+-------+------------------+---------+---------+------+------+--------------------------+
| id | select_type | table | type  | possible_keys    | key     | key_len | ref  | rows | Extra                    |
+----+-------------+-------+-------+------------------+---------+---------+------+------+--------------------------+
|  1 | SIMPLE      | t     | range | a_index,ab_index | a_index | 5       | NULL |   10 | Using where; Using index |
+----+-------------+-------+-------+------------------+---------+---------+------+------+--------------------------+
1 row in set (0.00 sec)

我们再创建一个复合索引看看。

mysql> alter table t add index ab_index(a,b);
Query OK, 0 rows affected (0.19 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> explain select * from t where a > 1000;
+----+-------------+-------+-------+------------------+----------+---------+------+-------+--------------------------+
| id | select_type | table | type  | possible_keys    | key      | key_len | ref  | rows  | Extra                    |
+----+-------------+-------+-------+------------------+----------+---------+------+-------+--------------------------+
|  1 | SIMPLE      | t     | range | a_index,ab_index | ab_index | 5       | NULL | 50166 | Using where; Using index |
+----+-------------+-------+-------+------------------+----------+---------+------+-------+--------------------------+
1 row in set (0.00 sec)

这条 sql 刚刚在上面也有讲到过，在没有创建复合索引的时候，是走的全表扫描，现在其实是利用了覆盖索引，同样是免去了回表过程，即在（ab_index）索引上就能找出要查询的字段。

这篇文章通过几个实例介绍了如何使用 explain 分析一条 sql 的执行计划，也提到了一些常见的索引优化，事实上还有更多的可能性，你也可以自己去写一个 sql ，然后使用 explain 分析，看看有哪些是可以被优化的。

这篇文章我断断续续写了有三四天了，本来准备了更多的例子，但每次都是写了一部分，思路也打乱了，好了，有问题欢迎在下面留言交流，文章对你有帮助，点个赞表示鼓励支持。

更多MySQL相关技术文章，请访问MySQL教程栏目进行学习！

以上是如何分析一條sql的效能的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn