ホームページ >データベース >mysql チュートリアル >mysql优化
【51CTO独家特稿】WEB开发者不光要解决程序的效率问题,对数据库的快速访问和相应也是一个大问题。希望本文能对大家掌握MySQL优化技巧有所帮助。 1.优化你的MySQL查询缓存 在MySQL服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提
【51CTO独家特稿】WEB开发者不光要解决程序的效率问题,对数据库的快速访问和相应也是一个大问题。希望本文能对大家掌握MySQL优化技巧有所帮助。
1.优化你的MySQL查询缓存
在MySQL服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提高性能的最有效方法之一。当同一个查询被执行多次时,如果结果是从缓存中提取,那是相当快的。
但主要的问题是,它是那么容易被隐藏起来以至于我们大多数程序员会忽略它。在有些处理任务中,我们实际上是可以阻止查询缓存工作的。
<ol> <li><span><span>// query cache does </span><span><span>NOT</span></span><span> </span><span><strong><span>work</span></strong></span><span> </span></span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user WHERE signup_date >= CURDATE()"</span></span><span>); </span> </li> <li><span> </span></li> <li><span>// query cache works! </span></li> <li> <span>$today = </span><span><strong><span>date</span></strong></span><span>(</span><span><span>"Y-m-d"</span></span><span>); </span> </li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user WHERE signup_date >= '$today'"</span></span><span>); </span> </li> <li><span> </span></li> <li> <span>// query cache does </span><span><span>NOT</span></span><span> </span><span><strong><span>work</span></strong></span><span> </span> </li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user WHERE signup_date >= CURDATE()"</span></span><span>); </span> </li> <li><span> </span></li> <li><span>// query cache works! </span></li> <li> <span>$today = </span><span><strong><span>date</span></strong></span><span>(</span><span><span>"Y-m-d"</span></span><span>); </span> </li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user WHERE signup_date >= '$today'"</span></span><span>); </span> </li> </ol>
2.用EXPLAIN使你的SELECT查询更加清晰
使用EXPLAIN关键字是另一个MySQL优化技巧,可以让你了解MySQL正在进行什么样的查询操作,这可以帮助你发现瓶颈的所在,并显示出查询或表结构在哪里出了问题。
EXPLAIN查询的结果,可以告诉你那些索引正在被引用,表是如何被扫描和排序的等等。
实现一个SELECT查询(最好是比较复杂的一个,带joins方式的),在里面添加上你的关键词解释,在这里我们可以使用phpMyAdmin,他会告诉你表中的结果。举例来说,假如当我在执行joins时,正忘记往一个索引中添加列,EXPLAIN能帮助我找到问题的所在。
添加索引到group_id field后
3.利用LIMIT 1取得唯一行
有时,当你要查询一张表是,你知道自己只需要看一行。你可能会去的一条十分独特的记录,或者只是刚好检查了任何存在的记录数,他们都满足了你的WHERE子句。
在这种情况下,增加一个LIMIT 1会令你的查询更加有效。这样数据库引擎发现只有1后将停止扫描,而不是去扫描整个表或索引。、
<ol> <li><span><span>// do I have </span><span>any</span><span> users </span><span>from</span><span> Alabama? </span></span></li> <li> <span>// what </span><span>NOT</span><span> </span><span>to</span><span> do: </span> </li> <li> <span>$r = mysql_query(</span><span>"SELECT * FROM user WHERE state = 'Alabama'"</span><span>); </span> </li> <li><span>if (mysql_num_rows($r) > 0) { </span></li> <li><span> // ... </span></li> <li><span>} </span></li> <li><span>// much better: </span></li> <li> <span>$r = mysql_query(</span><span>"SELECT 1 FROM user WHERE state = 'Alabama' LIMIT 1"</span><span>); </span> </li> <li><span>if (mysql_num_rows($r) > 0) { </span></li> <li><span> // ... </span></li> <li><span>} </span></li> </ol>
4. 索引中的检索字段
索引不仅是主键或唯一键。如果你想搜索表中的任何列,你应该一直指向索引。
5.保证连接的索引是相同的类型
如果应用程序中包含多个连接查询,你需要确保你链接的列在两边的表上都被索引。这会影响MySQL如何优化内部联接操作。
此外,加入的列,必须是同一类型。例如,你加入一个DECIMAL列,而同时加入另一个表中的int列,MySQL将无法使用其中至少一个指标。即使字符编码必须同为字符串类型。
<ol> <li><span><span>// looking </span><span><strong><span>for</span></strong></span><span> companies </span><span><span>in</span></span><span> my state </span></span></li> <li> <span>$r = mysql_query("</span><span><strong><span>SELECT</span></strong></span><span> company_name </span><span><strong><span>FROM</span></strong></span><span> users </span> </li> <li> <span> </span><span><span>LEFT</span></span><span> </span><span><span>JOIN</span></span><span> companies </span><span><strong><span>ON</span></strong></span><span> (users.state = companies.state) </span> </li> <li> <span> </span><span><strong><span>WHERE</span></strong></span><span> users.id = $user_id"); </span> </li> <li><span> </span></li> <li><span>// both state columns should be indexed </span></li> <li> <span>// </span><span><span>and</span></span><span> they both should be the same type </span><span><span>and</span></span><span> </span><span><strong><span>character</span></strong></span><span> encoding </span> </li> <li> <span>// </span><span><span>or</span></span><span> MySQL might do </span><span><strong><span>full</span></strong></span><span> </span><span><strong><span>table</span></strong></span><span> scans </span> </li> </ol>
6.不要使用BY RAND()命令
这是一个令很多新手程序员会掉进去的陷阱。你可能不知不觉中制造了一个可怕的平静。这个陷阱在你是用BY RAND()命令时就开始创建了。
如果您真的需要随机显示你的结果,有很多更好的途径去实现。诚然这需要写更多的代码,但是能避免性能瓶颈的出现。问题在于,MySQL可能会为表中每一个独立的行执行BY RAND()命令(这会消耗处理器的处理能力),然后给你仅仅返回一行。
<ol> <li><span><span>// what </span><span><span>NOT</span></span><span> </span><span><strong><span>to</span></strong></span><span> do: </span></span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user ORDER BY RAND() LIMIT 1"</span></span><span>); </span> </li> <li><span>// much better: </span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT count(*) FROM user"</span></span><span>); </span> </li> <li><span>$d = mysql_fetch_row($r); </span></li> <li><span>$rand = mt_rand(0,$d[0] - 1); </span></li> <li><span> </span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user LIMIT $rand, 1"</span></span><span>); </span> </li> </ol>
7.尽量避免SELECT *命令
从表中读取越多的数据,查询会变得更慢。他增加了磁盘需要操作的时间,还是在数据库服务器与WEB服务器是独立分开的情况下。你将会经历非常漫长的网络延迟,仅仅是因为数据不必要的在服务器之间传输。
始终指定你需要的列,这是一个非常良好的习惯。
<ol> <li><span><span>// </span><span><span>not</span></span><span> preferred </span></span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT * FROM user WHERE user_id = 1"</span></span><span>); </span> </li> <li><span>$d = mysql_fetch_assoc($r); </span></li> <li> <span>echo </span><span><span>"Welcome {$d['username']}"</span></span><span>; </span> </li> <li><span>// better: </span></li> <li> <span>$r = mysql_query(</span><span><span>"SELECT username FROM user WHERE user_id = 1"</span></span><span>); </span> </li> <li><span>$d = mysql_fetch_assoc($r); </span></li> <li> <span>echo </span><span><span>"Welcome {$d['username']}"</span></span><span>; </span> </li> <li> <span>// the differences are more significant </span><span><strong><span>with</span></strong></span><span> bigger result sets </span> </li> </ol>
8.从PROCEDURE ANALYSE()中获得建议
PROCEDURE ANALYSE()可让MySQL的柱结构分析和表中的实际数据来给你一些建议。如果你的表中已经存在实际数据了,能为你的重大决策服务。
9.准备好的语句
准备好的语句,可以从性能优化和安全两方面对大家有所帮助。
准备好的语句在过滤已经绑定的变量默认情况下,能给应用程序以有效的保护,防止SQL注入攻击。当然你也可以手动过滤,不过由于大多数程序员健忘的性格,很难达到效果。
<ol> <li><span><span>// </span><span><strong><span>create</span></strong></span><span> a prepared statement </span></span></li> <li> <span>if ($stmt = $mysqli-></span><span><strong><span>prepare</span></strong></span><span>(</span><span><span>"SELECT username FROM user WHERE state=?"</span></span><span>)) { </span> </li> <li><span> // bind parameters </span></li> <li> <span> $stmt->bind_param(</span><span><span>"s"</span></span><span>, $state); </span> </li> <li> <span> // </span><span><strong><span>execute</span></strong></span><span> </span> </li> <li> <span> $stmt-></span><span><strong><span>execute</span></strong></span><span>(); </span> </li> <li><span> // bind result variables </span></li> <li><span> $stmt->bind_result($username); </span></li> <li> <span> // </span><span><strong><span>fetch</span></strong></span><span> value </span> </li> <li> <span> $stmt-></span><span><strong><span>fetch</span></strong></span><span>(); </span> </li> <li> <span> printf(</span><span><span>"%s is from %s\n"</span></span><span>, $username, $state); </span> </li> <li> <span> $stmt-></span><span><strong><span>close</span></strong></span><span>(); </span> </li> <li><span>} </span></li> </ol>
10.将IP地址存储为无符号整型
许多程序员在创建一个VARCHAR(15)时并没有意识到他们可以将IP地址以整数形式来存储。当你有一个INT类型时,你只占用4个字节的空间,这是一个固定大小的领域。
你必须确定你所操作的列是一个UNSIGNED INT类型的,因为IP地址将使用32位unsigned integer。
<ol><li><span><span>$r = </span><span><span>"UPDATE users SET ip = INET_ATON('{$_SERVER['REMOTE_ADDR']}') WHERE user_id = $user_id"</span></span><span>; </span></span></li></ol><p></p>
2
select inet_ntoa (ip) from web_ip where id=1
select ip from web_ip where id=1
11.是否运用框架
select id from collect order by id limit 90000,10; 很快,0.04秒就OK。 为什么?因为用了id主键做索引当然快。网上的改法是:
select id,title from collect where id>=(select id from collect order by id limit 90000,1) limit 10;
这就是用了id做索引的结果。可是问题复杂那么一点点,就完了。看下面的语句
select id from collect where vtype=1 order by id limit 90000,10; 很慢,用了8-9秒!
对于大型系统,PHP千万不能用框架,尤其是那种连sql语句都看不到的框架!因为开始对于我的轻量级框架都差点崩 溃!只适合小型应用的快速开发,对于ERP,OA,大型网站,数据层包括逻辑层的东西都不能用框架。如果程序员失去了对sql语句的把控,那项目的风险将
会成几何级数增加!尤其是用mysql 的时候,mysql 一定需要专业的dba 才可以发挥他的最佳性能。一个索引所造成的性能差别可能是上千倍!
12.关于索引
Hash 索引结构的特殊性,其检索效率非常高,索引的检索可以一次定位,不像B-Tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的IO访问,所以 Hash 索引的查询效率要远高于 B-Tree 索引。
可
能很多人又有疑问了,既然 Hash 索引的效率要比 B-Tree 高很多,为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢?任何事物都是有两面性的,Hash 索引也一样,虽然 Hash 索引效率高,但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端,主要有以下这些。
(1)Hash 索引仅仅能满足"=","IN"和""查询,不能使用范围查询。
由于 Hash 索引比较的是进行 Hash 运算之后的 Hash 值,所以它只能用于等值的过滤,不能用于基于范围的过滤,因为经过相应的 Hash 算法处理之后的 Hash 值的大小关系,并不能保证和Hash运算前完全一样。
(2)Hash 索引无法被用来避免数据的排序操作。
由于 Hash 索引中存放的是经过 Hash 计算之后的 Hash 值,而且Hash值的大小关系并不一定和 Hash 运算前的键值完全一样,所以数据库无法利用索引的数据来避免任何排序运算;
(3)Hash 索引不能利用部分索引键查询。
对于组合索引,Hash 索引在计算 Hash 值的时候是组合索引键合并后再一起计算 Hash 值,而不是单独计算 Hash 值,所以通过组合索引的前面一个或几个索引键进行查询的时候,Hash 索引也无法被利用。
(4)Hash 索引在任何时候都不能避免表扫描。
前面已经知道,Hash 索引是将索引键通过 Hash 运算之后,将 Hash运算结果的 Hash 值和所对应的行指针信息存放于一个 Hash 表中,由于不同索引键存在相同 Hash 值,所以即使取满足某个 Hash 键值的数据的记录条数,也无法从 Hash 索引中直接完成查询,还是要通过访问表中的实际数据进行相应的比较,并得到相应的结果。
(5)Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。
对于选择性比较低的索引键,如果创建 Hash 索引,那么将会存在大量记录指针信息存于同一个 Hash 值相关联。这样要定位某一条记录时就会非常麻烦,会浪费多次表数据的访问,而造成整体性能低下。