집 >데이터 베이스 >MySQL 튜토리얼 >Oracle中的SQL语句性能调整原则
欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入 一、问题的提出 在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的
欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入
一、问题的提出<p></p><p> <span> </span><span>select</span><span> </span><span>*</span><span> </span><span>from</span><span> employss </span><span>where</span><span> first_name</span><span>||</span><span>''</span><span>||</span><span>last_name </span><span>=</span><span>'</span><span>Beill Cliton</span><span>'</span><span>; </span></p>
上面这条语句完全可以查询出是否有Bill Cliton这个员工,但是这里需要注意,系统优化器对基于last_name创建的索引没有使用。
当采用下面这种SQL语句的编写,Oracle系统就可以采用基于last_name创建的索引。
<p></p><p> <span> </span><span>Select</span><span> </span><span>*</span><span> </span><span>from</span><span> employee </span><span>where</span><span> first_name </span><span>=</span><span>'</span><span>Beill</span><span>'</span><span> </span><span>and</span><span> last_name </span><span>=</span><span>'</span><span>Cliton</span><span>'</span><span>; </span></p>
遇到下面这种情况又如何处理呢?如果一个变量(name)中存放着Bill Cliton这个员工的姓名,对于这种情况我们又如何避免全程遍历,使用索引呢?可以使用一个函数,将变量name中的姓和名分开就可以了,但是有一点需要注意,这个函数是不能作用在索引列上。下面是SQL查询脚本:
<p></p><p> <span> </span><span>select</span><span> </span><span>*</span><span> </span><span>from</span><span> employee </span><span>where</span><span> first_name </span><span>=</span><span> SUBSTR(</span><span>'</span><span>&&name</span><span>'</span><span>,</span><span>1</span><span>,INSTR(</span><br><span>'</span><span>&&name</span><span>'</span><span>,</span><span>'</span><span> </span><span>'</span><span>)</span><span>-</span><span>1</span><span>) </span><span>and</span><span> last_name </span><span>=</span><span> SUBSTR(</span><span>'</span><span>&&name</span><span>'</span><span>,INSTR(</span><span>'</span><span>&&name’,</span><span>'</span><span> </span><span>'</span><span>)+1) </span></p>
3. 带通配符(%)的like语句
同样以上面的例子来看这种情况。目前的需求是这样的,要求在职工表中查询名字中包含cliton的人。可以采用如下的查询SQL语句:
<p></p><p> <span>select</span><span> </span><span>*</span><span> </span><span>from</span><span> employee </span><span>where</span><span> last_name </span><span>like</span><span> </span><span>'</span><span>%cliton%</span><span>'</span><span>; </span></p>
这里由于通配符(%)在搜寻词首出现,所以Oracle系统不使用last_name的索引。在很多情况下可能无法避免这种情况,但是一定要心中有底,通配符如此使用会降低查询速度。然而当通配符出现在字符串其他位置时,优化器就能利用索引。在下面的查询中索引得到了使用:
<p></p><p> <span>select</span><span> </span><span>*</span><span> </span><span>from</span><span> employee </span><span>where</span><span> last_name </span><span>like</span><span> </span><span>'</span><span>c%</span><span>'</span><span>; </span></p>
4. Order by语句
ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。任何在Order by语句的非索引项或者有计算表达式都将降低查询速度。
仔细检查order by语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写order by语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在order by子句中使用表达式。
5. NOT
我们在查询时经常在where子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可以使用and(与)、or(或)以及not(非)。NOT可用来对任何逻辑运算符号取反。下面是一个NOT子句的例子:
... where not (status ='VALID')
如果要使用NOT,则应在取反的短语前面加上括号,并在短语前面加上NOT运算符。NOT运算符包含在另外一个逻辑运算符中,这就是不等于()运算符。换句话说,即使不在查询where子句中显式地加入NOT词,NOT仍在运算符中,见下例:
... where status 'INVALID';
再看下面这个例子:
select * from employee where salary3000;
对这个查询,可以改写为不使用NOT:
select * from employee where salary3000;
虽然这两种查询的结果一样,但是第二种查询方案会比第一种查询方案更快些。第二种查询允许Oracle对salary列使用索引,而第一种查询则不能使用索引。
6. IN和EXISTS
有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可以使用两种格式的子查询。
第一种格式是使用IN操作符:
... where column in(select * from ... where ...);
第二种格式是使用EXIST操作符:
... where exists (select 'X' from ...where ...);
我相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效率高。在Oracle中可以几乎将所有的IN操作符子查询改写为使用EXISTS的子查询。
第二种格式中,子查询以‘select 'X'开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在where语句中使用的列存在索引)。相对于IN子句来说,EXISTS使用相连子查询,构造起来要比IN子查询困难一些。
通过使用EXIST,Oracle系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。Oracle系统在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因。
同时应尽可能使用NOT EXISTS来代替NOT IN,尽管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查询效率更高。
另外一些提高表连接的查询速度的方法:
1.在表连接查询时,常常用下列查询方法查询数据是:
<p></p><p> <span> </span><span>SELECT</span><span> RECORDNO,NAME,AGE </span><span>FROM</span><span> 表1 </span><span>WHERE</span><span> 表1.RECORDNO </span><span>NOT</span><span> </span><span>IN</span><br><span> (</span><span>SELECT</span><span> RECORDNO </span><span>FROM</span><span> 表2 </span><span>WHERE</span><span> BIRTHDAY</span><span>=</span><span>’</span><span>710618</span><span>’); </span></p>
笔者发现,如果表1的长度为6000条记录,表2的长度为1000条记录, 则要4分钟才能出结果。原因是使用了比较运算符 NOT IN ,它的逻辑测试速度是最慢的。利用外连接替换NOT IN 运算符,查询时间则缩短为50秒。修改方法如下:
<p></p><p> <span> </span><span>SELECT</span><span> RECORDNO,NAME,AGE </span><span>FROM</span><span> 表1,表2 </span><span>WHERE</span><span> 表1.RECORDNO</span><span>=</span><span>表2.RECORDNO(</span><span>+</span><span>)<br> </span><span>AND</span><span> 表2.RECORDNO </span><span>IS</span><span> </span><span>NULL</span><span> </span><span>AND</span><span> 表2.BIRTHDAY(</span><span>+</span><span>)</span><span>=</span><span>’</span><span>710618</span><span>’;</span></p>