MySQL中使用or、in与union all在查询命令下的效率对比

首页

数据库

mysql教程

MySQL中使用or、in与union all在查询命令下的效率对比_MySQL

PHP中文网

May 27, 2016 pm 01:45 PM

OR、in和union all 查询效率到底哪个快？
网上很多的声音都是说union all 快于 or、in，因为or、in会导致全表扫描，他们给出了很多的实例。
但真的union all真的快于or、in？

EXPLAIN SELECT * from employees where employees.first_NAME =&#39;Georgi&#39; UNION ALL SELECT * from employees where employees.first_NAME =&#39;Bezalel&#39;

这条语句执行结果481条，执行时间为0.35s

PRIMARY employees ALL 300141 Using where

UNION employees ALL 300141 Using where

 UNION RESULTALL 

explain SELECT * FROM employees WHERE employees.first_name IN (&#39;Georgi&#39;,&#39;Bezalel&#39;)

这条语句的执行结果时间为0.186s

SIMPLE  employees  ALL  300141  Using where

explain SELECT * FROM employees WHERE employees.first_name =&#39;Georgi&#39; or employees.first_name=&#39;Bezalel&#39;

这条语句的执行结果和in的结果差不多

难道是网上的说法有误？难道和索引有关？在firstname上建立了一个索引

重新执行

union的执行执行计划如下，执行时间为0.004s

PRIMARY  employees  ref  index_firstname  index_firstname  44  const  253  Using where
UNION  employees  ref  index_firstname  index_firstname  44  const  228  Using where
UNION RESULTALL

in的执行计划如下，执行时间也为0.004s

SIMPLE  employees  range  index_firstname  index_firstname  44  481  Using where

or的执行计划如下，执行时间也为0.004s

SIMPLE  employees  range  index_firstname  index_firstname  44  481  Using where

感觉性能差不多啊。但是注意执行计划中的type，ref要好于range哦(ref为非唯一性索引扫描，range为索引范围扫描）
突然感觉好像和网上说的差不多了，但是第一个语句走了两个ref扫描会不会效率比走一次range的扫描低啊。

要不我再试试主键，这个是唯一的，会不会和网上的效果一直呢？

EXPLAIN SELECT * FROM employees WHERE employees.EMP_NO=100001 UNION ALL SELECT * FROM employees WHERE employees.EMP_NO=101100

union的执行计划如下

PRIMARY  employees  const  PRIMARY  PRIMARY  4  const  1  
UNION  employees  const  PRIMARY  PRIMARY  4  const  1  
UNION RESULTALL  

EXPLAIN SELECT * FROM employees WHERE employees.EMP_NO IN (100001 ,101100)

in的执行计划如下

SIMPLE  employees  range  PRIMARY  PRIMARY  4  2  Using where

EXPLAIN SELECT * FROM employees WHERE employees.EMP_NO=100001 OR emp_no=101100

or的执行计划如下

SIMPLE  employees  range  PRIMARY  PRIMARY  4  2  Using where

感觉结果和第二个实验还是差不多。

下面本文就采用实例来探讨在实际的查询命令下它们之间的效率对比究竟如何。
1：创建表，插入数据、数据量为1千万【要不效果不明显】。

drop table if EXISTS BT; 
create table BT( 
  ID int(10) NOT NUll, 
  VName varchar(20) DEFAULT &#39;&#39; NOT NULL, 
  PRIMARY key( ID ) 
)ENGINE=INNODB;

该表只有两个字段 ID为主键【索引页类似】，一个是普通的字段。（偷懒就用简单的表结构呢）
向BT表中插入1千万条数据
这里我写了一个简单的存储过程【所以你的mysql版本至少大于5.0，俺的版本为5.1】，代码如下。
注意：最好

  INSERT INTO BT ( ID,VNAME ) VALUES( i, CONCAT( &#39;M&#39;, i ) );---1

修改为

  INSERT INTO BT ( ID,VNAME ) VALUES( i, CONCAT( &#39;M&#39;, i, &#39;TT&#39; ) );---2

   修改原因在
   非索引列及VNAME使用了联合进行完全扫描请使用1 。
   非索引列及VNAME使用了全表扫描请使用2 。

DROP PROCEDURE IF EXISTS test_proc; 
CREATE PROCEDURE test_proc() 
BEGIN 
declare i int default 0; 
set autocommit = 0; 
while i<10000000 do 
INSERT INTO BT ( ID,VNAME ) VALUES( i, CONCAT( &#39;M&#39;, i ) ); 
set i = i+1; 
if i%2000 = 0 then 
commit; 
end if; 
end while; 
END;

就不写注释呢，挺简单的。
存储过程是最好设置下innob的相关参数【主要和日志、写缓存相关这样能加快插入】，俺没有设置插入1千万条数据插了6分钟。
部分数据如下：1千万数据类似

20151120103034816.jpg (264×198)

2：实战
2.1 :分别在索引列上使用 or、in、union all
我们创建的表只有主键索引，所以只能用ID做查询呢。我们查 ID 为 98，85220，9888589的三个数据各个耗时如下：

20151120103126115.jpg (622×560)

时间都为0.00，怎么会这样呢，呵呵所有查询都是在毫秒级别。
我使用其他的工具--EMS SQL Manager for mysql
查询显示时间为
93 ms， 94ms，93 ms，时间相差了多少几乎可以忽略。
然后我们在看看各自的执行计划

20151120103145800.jpg (925×565)

这里要注意的字段type 与ref字段
我们发现union all 的所用的 type【type为显示连接使用了何种类型】为ref 而or和in为range【ref连接类型优于range，相差不了多少】，而查询行数都一样【看rows字段都是为3】。
从整个的过程来看，在索引列使用常数or及in和union all查询相差不了多少。
但为什么在有的复杂查询中，再索引列使用or及in 比union all 速度慢很多呢，这可能是你的查询写的不够合理，让mysql放弃索引而进行全表扫描。
2.2：在非索引列中使用 or、in及union all。
我们查 VNAME 为 M98，M85220，M9888589的三个数据各个耗时如下：

20151120103205820.jpg (638×573)

我们发现为啥union all查询时间几乎为 or 和in的三倍。
这是为什么呢，我们先不说，先看看三个的查询计划。

20151120103224862.jpg (1004×554)

这里我们发现计划几乎一样。
但我们要注意扫描的此时对于 or及in 来说只对表扫描一次即rows是列为9664782。
而对于union all 来说对表扫描了三次即rows的和为9664782*3。
这也是为什么我们看到union all 为几乎为三倍的原因。
备注：如果使用存储过程使用第二sql该执行计划所有的type列为 all，其实这个是我最想演示的，但现在已经快写完毕了才发现问题将错就错呢。

3:总结
     3.1：不要迷信union all 就比 or及in 快，要结合实际情况分析到底使用哪种情况。
     3.2：对于索引列来最好使用union all，因复杂的查询【包含运算等】将使or、in放弃索引而全表扫描，除非你能确定or、in会使用索引。
    3.3：对于只有非索引字段来说你就老老实实的用or 或者in，因为非索引字段本来要全表扫描而union all 只成倍增加表扫描的次数。
    3.4：对于及有索引字段【索引字段有效】又包含非索引字段来时，按理你也使用or 、in或者union all 都可以，
       但是我推荐使用or、in。
      如以下查询：

select * from bt where bt.VName = &#39;M98&#39; or bt.id =&#39;9888589&#39; 
 
select * from bt where bt.VName = &#39;M98&#39; 
UNION ALL 
select * from bt where bt.id = &#39;9888589&#39;

该两个查询速度相差多少主要取决于索引列查询时长，如索引列查询时间太长的话，那你也用or或者in代替吧。
3.5：以上主要针对的是单表，而多表联合查询来说，考虑的地方就比较多了，比如连接方式，查询表数据量分布、索引等，再结合单表的策略选择合适的关键字。

以上就是MySQL中使用or、in与union all在查询命令下的效率对比_MySQL的内容，更多相关内容请关注PHP中文网（www.php.cn）！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

MySQL的许可与其他数据库系统相比如何？Apr 25, 2025 am 12:26 AM

MySQL使用的是GPL许可证。1）GPL许可证允许自由使用、修改和分发MySQL，但修改后的分发需遵循GPL。2）商业许可证可避免公开修改，适合需要保密的商业应用。

您什么时候选择InnoDB而不是Myisam，反之亦然？Apr 25, 2025 am 12:22 AM

选择InnoDB而不是MyISAM的情况包括：1)需要事务支持，2)高并发环境，3)需要高数据一致性；反之，选择MyISAM的情况包括：1)主要是读操作，2)不需要事务支持。InnoDB适合需要高数据一致性和事务处理的应用，如电商平台，而MyISAM适合读密集型且无需事务的应用，如博客系统。

在MySQL中解释外键的目的。Apr 25, 2025 am 12:17 AM

在MySQL中，外键的作用是建立表与表之间的关系，确保数据的一致性和完整性。外键通过引用完整性检查和级联操作维护数据的有效性，使用时需注意性能优化和避免常见错误。

MySQL中有哪些不同类型的索引？Apr 25, 2025 am 12:12 AM

MySQL中有四种主要的索引类型：B-Tree索引、哈希索引、全文索引和空间索引。1.B-Tree索引适用于范围查询、排序和分组，适合在employees表的name列上创建。2.哈希索引适用于等值查询，适合在MEMORY存储引擎的hash_table表的id列上创建。3.全文索引用于文本搜索，适合在articles表的content列上创建。4.空间索引用于地理空间查询，适合在locations表的geom列上创建。

您如何在MySQL中创建索引？Apr 25, 2025 am 12:06 AM

toCreateAnIndexinMysql，usethecReateIndexStatement.1）forasingLecolumn，使用“ createIndexIdx_lastNameEnemployees（lastName）; 2）foracompositeIndex，使用“ createIndexIndexIndexIndexIndexDx_nameOmplayees（lastName，firstName，firstName）;” 3）forauniqe instex，creationexexexexex，

MySQL与Sqlite有何不同？Apr 24, 2025 am 12:12 AM

MySQL和SQLite的主要区别在于设计理念和使用场景：1.MySQL适用于大型应用和企业级解决方案，支持高性能和高并发；2.SQLite适合移动应用和桌面软件，轻量级且易于嵌入。

MySQL中的索引是什么？它们如何提高性能？Apr 24, 2025 am 12:09 AM

MySQL中的索引是数据库表中一列或多列的有序结构，用于加速数据检索。1）索引通过减少扫描数据量提升查询速度。2）B-Tree索引利用平衡树结构，适合范围查询和排序。3）创建索引使用CREATEINDEX语句，如CREATEINDEXidx_customer_idONorders(customer_id)。4）复合索引可优化多列查询，如CREATEINDEXidx_customer_orderONorders(customer_id,order_date)。5）使用EXPLAIN分析查询计划，避