TOP 1比不加TOP慢的疑惑-mysql教程-PHP中文网

首页

数据库

mysql教程

TOP 1比不加TOP慢的疑惑

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 03:15 PM

ttop去掉查询问题

问题描述：有一个查询如下，去掉 TOP 1 的时候，很快就出来结果了，但加上 TOP 1 的时候，一般要 2~3 秒才出数据，何解？ SELECT TOP 1 ??? A . INVNO FROM A , B WHERE A . Item = B . ItemNumber ??? AND B . OwnerCompanyCode IS NOT NULL ? 问题原因分

问题描述：

有一个查询如下，去掉 TOP 1 的时候，很快就出来结果了，但加上 TOP 1 的时候，一般要 2~3 秒才出数据，何解？

SELECT TOP 1

??? A. INVNO

FROM A, B

WHERE A. Item = B. ItemNumber

??? AND B. OwnerCompanyCode IS NOT NULL

问题原因分析：

在使用 TOP 1 的时候， SQL Server 会尽力先找出这条 TOP 1 的记录，这就导致它采用了与不加 TOP 时不一致的扫描算法， SQL Server 查询优化器始终认为，应该可以比较快的找到匹配的第 1 条记录，所以一般是使用嵌套循环的联接，则不加 TOP 1 时， SQL Server 会根据结构和数据的统计信息决策出联接策略。嵌套循环一般适用于联系的两个表，一个表的数据较大，而另一个表的数据较小的情况，如果查询匹配的值出现在扫描的前端，则在取 TOP 1 的情况下，是符合嵌套循环联系的使用条件的，但当匹配的数据出现在扫描的后端，或者是基本上没有匹配的数据时，则嵌套循环要扫描完成两个大表，这显然是不适宜的，也正是因为这种情况，导致了 TOP 1 比不加 TOP 1 的效率慢很多

关于此问题的模拟环境：

USE tempdb

SET NOCOUNT ON

--======================================

-- 创建测试环境

--======================================

RAISERROR ( ' 创建测试环境 ' , 10, 1) WITH NOWAIT

-- Table A

CREATE TABLE [dbo]. A(

??? [TranNumber] [int] IDENTITY ( 1, 1) NOT NULL,

??? [INVNO] [char]( 8) NOT NULL,

??? [ITEM] [char]( 15) NULL DEFAULT ( '' ),

??? PRIMARY KEY ( [TranNumber])

)

CREATE INDEX [indexONinvno] ON [dbo]. A( [INVNO])

CREATE INDEX [indexOnitem] ON [dbo]. A ( [ITEM])

CREATE INDEX [indexONiteminnvo] ON [dbo]. A( [INVNO], [ITEM])

-- Table B

CREATE TABLE [dbo]. B(

??? [ItemNumber] [char]( 15) NOT NULL DEFAULT ( '' ),

??? [CompanyCode] [char] ( 4) NOT NULL,

??? [OwnerCompanyCode] [char]( 4) NULL,

??? PRIMARY KEY ( [ItemNumber], [CompanyCode])

)

CREATE INDEX [ItemNumber] ON [dbo]. B( [ItemNumber])

CREATE INDEX [CompanyCode] ON [dbo]. B( [CompanyCode])

CREATE INDEX [OwnerCompanyCode] ON [dbo]. B( [OwnerCompanyCode])

--======================================

-- 生成测试数据

--======================================

RAISERROR ( ' 生成测试数据 ' , 10, 1) WITH NOWAIT

INSERT [dbo]. A( [INVNO], [ITEM])

SELECT LEFT( NEWID (), 8), RIGHT( NEWID (), 15)

FROM syscolumns A, syscolumns B

INSERT [dbo]. B( [ItemNumber], [CompanyCode], [OwnerCompanyCode])

SELECT RIGHT( NEWID (), 15), LEFT( NEWID (), 4), LEFT( NEWID (), 4)

FROM syscolumns A, syscolumns B

速度测试脚本：

--======================================

-- 进行查询测试

--======================================

RAISERROR ( ' 进行查询测试 ' , 10, 1) WITH NOWAIT

DECLARE @dt DATETIME , @id int , @loop int

DECLARE @ TABLE (

??? id int IDENTITY ,

??? [TOP 1] int ,

??? [WITHOUT TOP] int )

SET @loop = 0

WHILE @loop 10

BEGIN

??? SET @loop = @loop + 1

??? RAISERROR ( 'test %d' , 10, 1, @loop) WITH NOWAIT

??? SET @dt = GETDATE ()

??????? SELECT TOP 1

??????????? A. INVNO

??????? FROM A, B

??????? WHERE A. Item = B. ItemNumber

??????????? AND B. OwnerCompanyCode IS NOT NULL

??? INSERT @([TOP 1]) VALUES ( DATEDIFF ( ms, @dt, GETDATE ()))

??? SELECT @id = SCOPE_IDENTITY (), @dt = GETDATE ()

??????? SELECT --TOP 1

??????????? A. INVNO

??????? FROM A, B

??????? WHERE A. Item = B. ItemNumber

??????????? AND B. OwnerCompanyCode IS NOT NULL

??? UPDATE @ SET [WITHOUT TOP] = DATEDIFF ( ms, @dt, GETDATE ())

??? WHERE id = @id

END

SELECT * FROM @

UNION ALL

SELECT NULL, SUM ( [TOP 1]), SUM ( [WITHOUT TOP]) FROM @

测试数据的变更脚本：

DECLARE @value char ( 15), @value1 char ( 15)

SELECT

??? @value = LEFT( NEWID (), 15),

??? @value1 = LEFT( NEWID (), 15)

UPDATE A

SET Item = @value

FROM A

??? INNER JOIN(

??????? SELECT TOP 1

??????????? [TranNumber]

??????? FROM (

??????????? SELECT TOP 20 PERCENT

??????????????? [TranNumber]

??????????? FROM A

??????????? ORDER BY [TranNumber]

??????? ) AA

??????? ORDER BY [TranNumber] DESC

??? ) B

??????? ON A. [TranNumber] = B. [TranNumber]

UPDATE B

SET ItemNumber = @value

FROM B

??? INNER JOIN(

??? ??? SELECT TOP 1

??????????? [ItemNumber], [CompanyCode]

??????? FROM (

??????????? SELECT TOP 20 PERCENT

??????????????? [ItemNumber], [CompanyCode]

??????????? FROM B

??????????? ORDER BY [ItemNumber], [CompanyCode]

??????? ) BB

??????? ORDER BY [ItemNumber] DESC , [CompanyCode] DESC

??? ) B1

??????? ON B. [ItemNumber] = B1. [ItemNumber]

??????????? AND B. [CompanyCode] = B1. [CompanyCode]

测试说明：

1．?? 在刚建立好测试环境的时候，是没有任何匹配项的，这时候， TOP 1 会扫描两个表的所有数据，运行“速度测试脚本 ”可以看到此时有无 TOP 1 的效率差异： TOP 1 明显比不加 TOP 慢

2．?? 修改“测试数据的变更脚本 ”中，红色的 20 ，让匹配的数据出现在扫描的顶端、中间和尾端，分别使用 “速度测试脚本 ”测试，可以看到，匹配的值靠近扫描的前端的时候， TOP 1 比不加 TOP 快，随着匹配数据很后端的推移，这种效率差异会越来越小，到后面就变成 TOP 1 比不加 TOP 1 慢。

注意： 每次变更数据，并且完成“速度测试脚本 ”测试后，需要修改“测试数据的变更脚本 ”中，红色的 @ value 为 @value1 ，让刚才设置匹配的数据再变回为不匹配

附：联接的几种方式

1．???? 嵌套循环联接

嵌套循环联接也称为 “ 嵌套迭代 ” ，它将一个联接输入用作外部输入表（显示为图形执行计划中的顶端输入），将另一个联接输入用作内部（底端）输入表。外部循环逐行处理外部输入表。内部循环会针对每个外部行执行，在内部输入表中搜索匹配行。

最简单的情况是，搜索时扫描整个表或索引；这称为 “ 单纯嵌套循环联接 ” 。如果搜索时使用索引，则称为 “ 索引嵌套循环联接 ” 。如果将索引生成为查询计划的一部分（并在查询完成后立即将索引破坏），则称为 “ 临时索引嵌套循环联接 ” 。查询优化器考虑了所有这些不同情况。

如果外部输入较小而内部输入较大且预先创建了索引，则嵌套循环联接尤其有效。在许多小事务中（如那些只影响较小的一组行的事务），索引嵌套循环联接优于合并联接和哈希联接。但在大型查询中，嵌套循环联接通常不是最佳选择。

2．???? 合并联接

合并联接要求两个输入都在合并列上排序，而合并列由联接谓词的等效 (ON) 子句定义。通常，查询优化器扫描索引（如果在适当的一组列上存在索引），或在合并联接的下面放一个排序运算符。在极少数情况下，虽然可能有多个等效子句，但只用其中一些可用的等效子句获得合并列。

由于每个输入都已排序，因此 Merge Join 运算符将从每个输入获取一行并将其进行比较。例如，对于内联接操作，如果行相等则返回。如果行不相等，则废弃值较小的行并从该输入获得另一行。这一过程将重复进行，直到处理完所有的行为止。

合并联接操作可以是常规操作，也可以是多对多操作。多对多合并联接使用临时表存储行。如果每个输入中有重复值，则在处理其中一个输入中的每个重复项时，另一个输入必须重绕到重复项的开始位置。

如果存在驻留谓词，则所有满足合并谓词的行都将对该驻留谓词取值，而只返回那些满足该驻留谓词的行。

合并联接本身的速度很快，但如果需要排序操作，选择合并联接就会非常费时。然而，如果数据量很大且能够从现有 B 树索引中获得预排序的所需数据，则合并联接通常是最快的可用联接算法。

3．???? 哈希联接

哈希联接有两种输入：生成输入和探测输入。查询优化器指派这些角色，使两个输入中较小的那个作为生成输入。

哈希联接用于多种设置匹配操作：内部联接；左外部联接、右外部联接和完全外部联接；左半联接和右半联接；交集；联合和差异。此外，哈希联接的某种变形可以进行重复删除和分组，例如 SUM(salary) GROUP BY department 。这些修改对生成和探测角色只使用一个输入。

以下几节介绍了不同类型的哈希联接：内存中的哈希联接、 Grace 哈希联接和递归哈希联接。

内存中的哈希联接

哈希联接先扫描或计算整个生成输入，然后在内存中生成哈希表。根据计算得出的哈希键的哈希值，将每行插入哈希存储桶。如果整个生成输入小于可用内存，则可以将所有行都插入哈希表中。生成阶段之后是探测阶段。一次一行地对整个探测输入进行扫描或计算，并为每个探测行计算哈希键的值，扫描相应的哈希存储桶并生成匹配项。

Grace 哈希联接

如果生成输入大于内存，哈希联接将分为几步进行。这称为 “Grace 哈希联接 ” 。每一步都分为生成阶段和探测阶段。首先，消耗整个生成和探测输入并将其分区（使用哈希键上的哈希函数）为多个文件。对哈希键使用哈希函数可以保证任意两个联接记录一定位于相同的文件对中。因此，联接两个大输入的任务简化为相同任务的多个较小的实例。然后将哈希联接应用于每对分区文件。

递归哈希联接

如果生成输入非常大，以至于标准外部合并的输入需要多个合并级别，则需要多个分区步骤和多个分区级别。如果只有某些分区较大，则只需对那些分区使用附加的分区步骤。为了使所有分区步骤尽可能快，将使用大的异步 I/O 操作以便单个线程就能使多个磁盘驱动器繁忙工作。

border: 1pt solid #dedfef; padding: 0cm

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

如何解决 VS Code 中 IntelliSense 不起作用的问题Apr 21, 2023 pm 07:31 PM

最常称为VSCode的VisualStudioCode是开发人员用于编码的工具之一。Intellisense是VSCode中包含的一项功能，可让编码人员的生活变得轻松。它提供了编写代码的建议或工具提示。这是开发人员更喜欢的一种扩展。当IntelliSense不起作用时，习惯了它的人会发现很难编码。你是其中之一吗？如果是这样，请通过本文找到不同的解决方案来解决IntelliSense在VS代码中不起作用的问题。Intellisense如下所示。它在您编码时提供建议。首先检

linux top命令无法使用怎么办Mar 08, 2023 am 09:26 AM

linux top命令无法使用是因为系统中没有安装top命令，其解决办法就是通过“apt-get install procps”或者“yum install procps”命令安装top命令即可。

解决C++代码中出现的“error: redefinition of class 'ClassName'”问题Aug 25, 2023 pm 06:01 PM

解决C++代码中出现的“error:redefinitionofclass'ClassName'”问题在C++编程中，我们经常会遇到各种各样的编译错误。其中一个常见的错误是“error:redefinitionofclass'ClassName'”（类‘ClassName’的重定义错误）。这个错误通常出现在同一个类被定义了多次的情况下。本文将

win10下载不了steam怎么办Jul 07, 2023 pm 01:37 PM

Steam是十分受欢迎的一个平台游戏，拥有众多优质游戏，可是有些win10用户体现自己下载不了steam，这是怎么回事呢？极有可能是用户的ipv4服务器地址没有设置好。要想解决这个问题的话，你可以试着在兼容模式下安装Steam，随后手动修改一下DNS服务器，将其改成114.114.114.114，以后应当就能下载了。win10下载不了steam怎么办：WIn10下能够试着兼容模式下安装，更新后必须关掉兼容模式，不然网页将无法加载。点击程序安装的属性，以兼容模式运作运行这个程序。重启以增加内存，电

解决PHP报错：继承父类时遇到的问题Aug 17, 2023 pm 01:33 PM

解决PHP报错：继承父类时遇到的问题在PHP中，继承是一种重要的面向对象编程的特性。通过继承，我们能够重用已有的代码，并且能够在不修改原有代码的情况下，对其进行扩展和改进。尽管继承在开发中应用广泛，但有时候在继承父类时可能会遇到一些报错问题，本文将围绕解决继承父类时遇到的常见问题进行讨论，并提供相应的代码示例。问题一：未找到父类在继承父类的过程中，如果系统无

机器学习模型的泛化能力问题Oct 08, 2023 am 10:46 AM

机器学习模型的泛化能力问题，需要具体代码示例随着机器学习的发展和应用越来越广泛，人们越来越关注机器学习模型的泛化能力问题。泛化能力指的是机器学习模型对未标记数据的预测能力，也可以理解为模型在真实世界中的适应能力。一个好的机器学习模型应该具有较高的泛化能力，能够对新的数据做出准确的预测。然而，在实际应用中，我们经常会遇到模型在训练集上表现良好，但在测试集或真实

弱监督学习中的标签获取问题Oct 08, 2023 am 09:18 AM

弱监督学习中的标签获取问题，需要具体代码示例引言：弱监督学习是一种利用弱标签进行训练的机器学习方法。与传统的监督学习不同，弱监督学习只需利用较少的标签来训练模型，而不是每个样本都需要有准确的标签。然而，在弱监督学习中，如何从弱标签中准确地获取有用的信息是一个关键问题。本文将介绍弱监督学习中的标签获取问题，并给出具体的代码示例。弱监督学习中的标签获取问题简介：

如何处理Linux系统中频繁出现的服务器负载过高问题Jun 29, 2023 pm 11:56 PM

如何处理Linux系统中频繁出现的服务器负载过高问题摘要：本文介绍了如何处理Linux系统中频繁出现的服务器负载过高问题。通过优化系统配置、调整服务资源分配、检测问题进程和运行性能调优等方法，可以有效降低负载并提高服务器的性能和稳定性。一、引言服务器负载过高是Linux系统中常见的问题之一，会导致服务器运行缓慢、响应不及时，甚至无法正常工作。面对这个问题，我

See all articles