[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标倒-mysql教程-PHP中文網

首頁

資料庫

mysql教程

[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标倒

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:15 PM

mysql最佳化查詢

[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标记时案例梳理时间：2013-9-25 写在前面的话：在慢查优化1和2里都反复强调过 explain 的重要性，但有时候肉眼看不出 explain 结果如何指导优化，这时候还需要有一些其他基础知识的佐助，甚至需要

[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标记时
案例梳理时间：2013-9-25

写在前面的话：

在慢查优化1和2里都反复强调过 explain 的重要性，但有时候肉眼看不出 explain 结果如何指导优化，这时候还需要有一些其他基础知识的佐助，甚至需要了解 MySQL 实现原理，如子查询慢查优化。
看到 SQL 执行计划中 select_type 字段中出现“DEPENDENT SUBQUERY”时，要打起精神了！

——MySQL 的子查询为什么有时候很糟糕——

引子：这样的子查询为什么这么慢？

下面的例子是一个慢查，线上执行时间相当夸张。为什么呢？

SELECT gid,COUNT(id) as count?

FROM shop_goods g1

WHERE status =0 and gid IN (?

SELECT gid FROM shop_goods g2 WHERE sid IN ?(1519066,1466114,1466110,1466102,1466071,1453929)

)

GROUP BY gid;

它的执行计划如下，请注意看关键词“DEPENDENT SUBQUERY”：

??? id? select_type???????? table?? type??????????? possible_keys?????????????????????????? key?????????? key_len? ref?????? rows? Extra???? ?
------? ------------------? ------? --------------? --------------------------------------? ------------? -------? ------? ------? -----------
???? 1? PRIMARY???????????? g1????? index?????????? (NULL)????????????????????????????????? idx_gid? 5??????? (NULL)? 850672? Using where
???? 2? DEPENDENT SUBQUERY? g2????? index_subquery? id_shop_goods,idx_sid,idx_gid? idx_gid? 5??????? func???????? 1? Using where

基础知识：Dependent Subquery意味着什么

官方含义为：

SUBQUERY：子查询中的第一个SELECT；

DEPENDENT SUBQUERY：子查询中的第一个SELECT，取决于外面的查询 。

换句话说，就是?子查询对 g2 的查询方式依赖于外层 g1 的查询。

什么意思呢？它意味着两步：

第一步，MySQL 根据?select gid,count(id) from shop_goods where?status=0 group by gid;?得到一个大结果集 t1，其数据量就是上图中的 rows=850672 了。

第二步，上面的大结果集 t1 中的每一条记录，都将与子查询 SQL 组成新的查询语句：select gid from shop_goods where sid in (15...blabla..29) and gid=%t1.gid%。等于说，子查询要执行85万次……即使这两步查询都用到了索引，但不慢才怪。

如此一来，子查询的执行效率居然受制于外层查询的记录数，那还不如拆成两个独立查询顺序执行呢。

优化策略1：

你不想拆成两个独立查询的话，也可以与临时表联表查询，如下所示：

SELECT g1.gid,count(1)

FROM shop_goods g1,(select gid from shop_goods WHERE sid in (1519066,1466114,1466110,1466102,1466071,1453929)) g2

where g1.status=0 and?g1.gid=g2.gid

GROUP BY g1.gid;

也能得到同样的结果，且是毫秒级。

它的执行计划为：

??? id? select_type? table?????????? type??? possible_keys????????????? key??????????? key_len? ref??????????? rows? Extra???????????????????????? ?
------? -----------? --------------? ------? -------------------------? -------------? -------? -----------? ------? -------------------------------
???? 1? PRIMARY????? ????? ALL???? (NULL)???????????????????? (NULL)???????? (NULL)?? (NULL)?????????? 30? Using temporary; Using filesort
???? 1? PRIMARY????? g1????????????? ref???? idx_gid?????????????? idx_gid?? 5??????? g2.gid?????? 1? Using where?????????????????? ?
???? 2? DERIVED????? shop_goods? range?? id_shop_goods,idx_sid? id_shop_goods? 5??????? (NULL)?????????? 30? Using where; Using index??????

DERIVED 的官方含义为：

DERIVED：用于 from 子句里有子查询的情况。MySQL 会递归执行这些子查询，把结果放在临时表里。

DBA观点引用：MySQL 子查询的弱点

hidba 论述道（参考资源3）：

mysql 在处理子查询时，会改写子查询。

通常情况下，我们希望由内到外，先完成子查询的结果，然后再用子查询来驱动外查询的表，完成查询。

例如：

select * from test where tid in(select fk_tid from sub_test where gid=10)

通常我们会感性地认为该 sql 的执行顺序是：

sub_test 表中根据 gid 取得 fk_tid(2,3,4,5,6)记录，

然后再到 test 中，带入 tid=2,3,4,5,6，取得查询数据。

但是实际mysql的处理方式为：

select * from test where exists (

select * from sub_test where gid=10 and sub_test.fk_tid=test.tid

)

mysql 将会扫描 test 中所有数据，每条数据都将会传到子查询中与 sub_test 关联，子查询不会先被执行，所以如果 test 表很大的话，那么性能上将会出现问题。

《高性能MySQL》一书的观点引用

《高性能MySQL》的第4.4节“MySQL查询优化器的限制（Limitations of the MySQL Query Optimizer）”之第4.4.1小节“关联子查询（Correlated Subqueries）”也有类似的论述：

MySQL有时优化子查询很糟，特别是在WHERE从句中的IN()子查询。……

比如在sakila数据库sakila.film表中找出所有的film，这些film的actoress包括Penelope Guiness(actor_id = 1)。可以这样写：

mysql> SELECT * FROM sakila.film

-> WHERE film_id IN(

-> SELECT film_id FROM sakila.film_actor WHERE actor_id = 1);

mysql> EXPLAIN SELECT * FROM sakila.film ...;

+----+--------------------+------------+--------+------------------------+

| id | select_type ? ? ? ?| table ? ? ?| type ? | possible_keys ? ? ? ? ?|

+----+--------------------+------------+--------+------------------------+

| 1 ?| PRIMARY ? ? ? ? ? ?| film ? ? ? | ALL ? ?| NULL ? ? ? ? ? ? ? ? ? |

| 2 ?|?DEPENDENT SUBQUERY?| film_actor | eq_ref | PRIMARY,idx_fk_film_id |

+----+--------------------+------------+--------+------------------------+

根据EXPLAIN的输出，MySQL将全表扫描film表，对找到的每行执行子查询，这是很不好的性能。幸运的是，很容易改写为一个join查询：

mysql> SELECT film.* FROM sakila.film

-> INNER JOIN sakila.film_actor USING(film_id)

-> WHERE actor_id = 1;

另外一个方法是通过使用GROUP_CONCAT()执行子查询作为一个单独的查询，手工产生IN()列表。有时候比join还快。（注：你不妨在我们的库上试试看?SELECT goods_id,GROUP_CONCAT(cast(id as char))

FROM bee_shop_goods

WHERE shop_id IN (1519066,1466114,1466110,1466102,1466071,1453929)

GROUP BY goods_id;）

MySQL已经因为这种特定类型的子查询执行计划而被批评。

?

何时子查询是好的

MySQL并不总是把子查询优化得很糟。有时候还是很优化的。下面是个例子：

mysql> EXPLAIN SELECT film_id, language_id FROM sakila.film

-> WHERE NOT EXISTS(

-> SELECT * FROM sakila.film_actor

-> WHERE film_actor.film_id = film.film_id

-> )G

……（注：具体文字还是请阅读《高性能MySQL》吧）

是的，子查询并不是总是被优化得很糟糕，具体问题具体分析，但别忘了 explain 。

参考资源：

1，2011，wudongxu，mysql子查询(in)的实现；

2，2012，iteye，MySQL子查询很慢的问题；

3，2011，hidba，mysql子查询的弱点?和?生产库中遇到mysql的子查询；

慢查系列：

[慢查优化]建索引时注意字段选择性 & 范围查询注意组合索引的字段顺序

[慢查优化]联表查询注意谁是驱动表 & 你搞不清楚谁join谁更好时请放手让mysql自行判定

赠图几枚：

/img/2013/12/08/230619118.jpg

@易度-潘俊勇: 许式伟的这个ppt，涵盖了他所有对golang的理解，推荐大家阅读： http://t.cn/zRI8tIH

/img/2013/12/08/230619119.jpg

/img/2013/12/08/230619120.jpg

-over-

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

修复：Windows 11 无法优化游戏的问题Apr 30, 2023 pm 01:28 PM

GeforceExperience不仅为您下载最新版本的游戏驱动程序，它还提供更多！最酷的事情之一是它可以根据您的系统规格优化您安装的所有游戏，为您提供最佳的游戏体验。但是一些游戏玩家报告了一个问题，即GeForceExperience没有优化他们系统上的游戏。只需执行这些简单的步骤即可在您的系统上解决此问题。修复1–为所有游戏使用最佳设置您可以设置为所有游戏使用最佳设置。1.在您的系统上打开GeForceExperience应用程序。2.GeForceExperience面

Nginx性能优化与安全设置Jun 10, 2023 am 09:18 AM

Nginx是一种常用的Web服务器，代理服务器和负载均衡器，性能优越，安全可靠，可以用于高负载的Web应用程序。在本文中，我们将探讨Nginx的性能优化和安全设置。一、性能优化调整worker_processes参数worker_processes是Nginx的一个重要参数。它指定了可以使用的worker进程数。这个值需要根据服务器硬件、网络带宽、负载类型等

Windows 11 Insiders 现在对在窗口模式下运行的传统游戏进行了优化Apr 25, 2023 pm 04:28 PM

如果您在Windows机器上玩旧版游戏，您会很高兴知道Microsoft为它们计划了某些优化，特别是如果您在窗口模式下运行它们。该公司宣布，最近开发频道版本的内部人员现在可以利用这些功能。本质上，许多旧游戏使用“legacy-blt”演示模型在您的显示器上渲染帧。尽管DirectX12(DX12)已经利用了一种称为“翻转模型”的新演示模式，但Microsoft现在也正在向DX10和DX11游戏推出这一增强功能。迁移将改善延迟，还将为自动HDR和可变刷新率(VRR)等进一步增强打

如何使用缓存优化PHP和MySQLMay 11, 2023 am 08:52 AM

随着互联网的不断发展和应用的扩展，越来越多的网站和应用需要处理海量的数据和实现高流量的访问。在这种背景下，对于PHP和MySQL这样的常用技术，缓存优化成为了非常必要的优化手段。本文将在介绍缓存的概念及作用的基础上，从两个方面的PHP和MySQL进行缓存优化的实现，希望能够为广大开发者提供一些帮助。一、缓存的概念及作用缓存是指将计算结果或读取数据的结果缓存到

一篇学会本地知识库对LLM的性能优化Jun 12, 2023 am 09:23 AM

昨天一个跑了220个小时的微调训练完成了，主要任务是想在CHATGLM-6B上微调出一个能够较为精确的诊断数据库错误信息的对话模型来。不过这个等了将近十天的训练最后的结果令人失望，比起我之前做的一个样本覆盖更小的训练来，差的还是挺大的。这样的结果还是有点令人失望的，这个模型基本上是没有实用价值的。看样子需要重新调整参数与训练集，再做一次训练。大语言模型的训练是一场军备竞赛，没有好的装备是玩不起来的。看样子我们也必须要升级一下实验室的装备了，否则没有几个十天可以浪费。从最近的几次失败的微调训练来看

如何通过优化查询中的LIKE操作来提高MySQL性能May 11, 2023 am 08:11 AM

MySQL是目前最流行的关系型数据库之一，但是在处理大量数据时，MySQL的性能可能会受到影响。其中，一种常见的性能瓶颈是查询中的LIKE操作。在MySQL中，LIKE操作是用来模糊匹配字符串的，它可以在查询数据表时用来查找包含指定字符或者模式的数据记录。但是，在大型数据表中，如果使用LIKE操作，它会对数据库的性能造成影响。为了解决这个问题，我们可

Snapchat优化指甲追踪效果，与OPI合推AR指甲油滤镜May 30, 2023 am 09:19 AM

5月26日消息，SnapchatAR试穿滤镜技术升级，并与OPI品牌合作，推出指甲油AR试用滤镜。据悉，为了优化AR滤镜对手指甲的追踪定位，Snap在LensStudio中推出手部和指甲分割功能，允许开发者将AR图像叠加在指甲这种细节部分。据青亭网了解，指甲分割功能在识别到人手后，会给手部和指甲分别设置掩膜，用于渲染2D纹理。此外，还会识别用户个人指甲的底色，来模拟指甲油真实上手的效果。从演示效果来看，新的AR指甲油滤镜可以很好的模拟浅蓝磨砂质地。实际上，此前Snapchat曾推出AR指甲油试用

Go语言中的优化和重构的方法Jun 02, 2023 am 10:40 AM

Go语言是一门相对年轻的编程语言，虽然从语言本身的设计来看，其已经考虑到了很多优化点，使得其具备高效的性能和良好的可维护性，但是这并不代表着我们在开发Go应用时不需要优化和重构，特别是在长期的代码积累过程中，原来的代码架构可能已经开始失去优势，需要通过优化和重构来提高系统的性能和可维护性。本文将分享一些在Go语言中优化和重构的方法，希望能够对Go开发者有所帮

See all articles