如何寫出高效能的sql-mysql教程-PHP中文網

首頁

資料庫

mysql教程

如何寫出高效能的sql

(*-*)浩

May 09, 2019 am 09:34 AM

mysql

首先要搞清楚什麼叫執行計劃？

執行計劃是資料庫根據SQL語句和相關表格的統計資訊所做的查詢方案，這個方案是由查詢最佳化器自動分析產生的，例如一條SQL語句如果用來從一個10萬筆記錄的表中查1筆記錄，那查詢優化器會選擇「索引查找」方式，如果表格進行了歸檔，目前只剩下5000筆記錄了，那查詢優化器就會改變方案，採用「全表掃描”方式。

可見，執行計劃並不是固定的，它是「個人化」的。產生一個正確的「執行計劃」有兩點很重要：

SQL語句是否清楚地告訴查詢最佳化器它想做什麼？

查詢優化器得到的資料庫統計資料是否是最新的、正確的？

推薦課程：MySQL教學。

如何寫出高效能的sql

統一SQL語句的寫法

#對於以下兩句SQL語句，程式設計師認為是相同的，資料庫查詢最佳化器認為是不同的。

select*from dual 
select*From dual

其實就是大小寫不同，查詢分析器就認為是兩句不同的SQL語句，必須進行兩次解析。產生2個執行計劃。所以身為程式設計師，應該要保證相同的查詢語句在任何地方都一致，多一個空格都不行！

不要把SQL語句寫得太複雜

我常常看到，從資料庫中捕捉到的一條SQL語句印出來有2張A4紙這麼長。一般來說這麼複雜的語句通常都是有問題的。我拿著這2頁長的SQL語句去請教原作者，結果他說時間太長，他一時也看不懂了。可想而知，連原作者都有可能看糊塗的SQL語句，資料庫也一樣會看糊塗。

一般，將一個Select語句的結果當作子集，然後從該子集中再進行查詢，這種一層嵌套語句還是比較常見的，但是根據經驗，超過3層嵌套，查詢優化器就很容易給出錯誤的執行計劃。因為它被繞暈了。像這種類似人工智慧的東西，終究比人的分辨力要差些，如果人都看暈了，我可以保證資料庫也會暈的。

另外，執行計劃是可以重複使用的，越簡單的SQL語句被重複使用的可能性越高。而複雜的SQL語句只要有一個字元改變就必須重新解析，然後再把這一大堆垃圾塞在記憶體裡。可想而知，資料庫的效率會何等低下。

使用「暫存表」暫存中間結果

#簡化SQL語句的重要方法就是採用暫存表暫存中間結果，但是，臨時表的好處遠遠不止這些，將臨時結果暫存在臨時表，後面的查詢就在tempdb中了，這可以避免程序中多次掃描主表，也大大減少了程序執行中“共享鎖”阻塞“更新鎖”，減少了阻塞，提高了並發性能。

OLTP系統SQL語句必須採用綁定變數

select*from orderheader where changetime >'2010-10-20 00:00:01' 
select*from orderheader where changetime >'2010-09-22 00:00:01'

以上兩句語句，查詢最佳化器認為是不同的SQL語句，需要解析兩次。如果採用綁定變數

select*from orderheader where changetime >@chgtime

@chgtime變數可以傳入任何值，這樣大量的類似查詢可以重複使用該執行計劃了，這可以大幅降低資料庫解析SQL語句的負擔。一次解析，多次重複使用，是提高資料庫效率的原則。

綁定變數窺測

事物都存在兩面性，綁定變數對大多數OLTP處理是適用的，但是也有例外。例如where條件中的欄位是「傾斜欄位」的時候。

「傾斜字段」指該列中的絕大多數的值都是相同的，例如一張人口調查表，其中「民族」這列，90%以上都是漢族。那麼如果一個SQL語句要查詢30歲的漢族人口有多少，那麼「民族」這列必然要放在where條件裡。這時候如果採用綁定變數@nation會存在很大問題。

試想如果@nation傳入的第一個值是“漢族”，那麼整個執行計劃必然會選擇表掃描。然後，第二個值傳入的是“布依族”，按理說“布依族”佔的比例可能只有萬分之一，應該採用索引查找。但是，由於重用了第一次解析的「漢族」的那個執行計劃，那麼第二次也將採用表格掃描方式。這個問題就是著名的“綁定變數窺測”，建議對於“傾斜欄位”不要採用綁定變數。

只在必要的情況下才使用begin tran

SQL Server中一句SQL語句預設就是一個事務，在該語句執行完成後也是預設commit的。其實，這就是begin tran的一個最小化的形式，好比在每句語句開頭隱含了一個begin tran，結束時隱含了一個commit。

有些情況下，我們需要明確聲明begin tran，例如做「插、刪、改」操作需要同時修改幾個表，要求要嘛幾個表都修改成功，要嘛都不成功。 begin tran 可以起到這樣的作用，它可以把若干SQL語句套在一起執行，最後再一起commit。好處是保證了數據的一致性，但任何事情都不是完美無缺的。 Begin tran付出的代價是在提交之前，所有SQL語句鎖住的資源都不能釋放，直到commit掉。

可見，如果Begin tran套住的SQL語句太多，那資料庫的效能就糟了。在該大事務提交之前，必然會阻塞別的語句，造成block很多。

Begin tran所使用的原則是，在保證資料一致性的前提下，begin tran 套住的SQL語句越少越好！有些情況下可以採用觸發器同步數據，不一定要用begin tran。

一些SQL查詢語句應加上nolock

在SQL語句中加上nolock是提高SQL Server並發效能的重要手段，在oracle中並不需要這樣做，因為oracle的結構更為合理，有undo表空間保存“數據前影”，該數據如果在修改中還未commit，那麼你讀到的是它修改之前的副本，該副本放在undo表空間中。這樣，oracle的讀、寫可以做到互不影響，這也是oracle 廣受稱讚的地方。 SQL Server 的讀取、寫入是會互相阻塞的，為了提高並發效能，對於一些查詢，可以加上nolock，這樣讀的時候可以允許寫，但缺點是可能讀到未提交的髒資料。使用 nolock有3個原則。

(1) 查詢的結果用於「插、刪、改」的不能加上nolock ！

(2) 查詢的表格屬於頻繁發生頁分裂的，慎用nolock ！

(3) 使用臨時表一樣可以保存“資料前影”，起到類似oracle的undo表空間的功能，

能採用臨時表提高並發性能的，不要用nolock 。

聚集索引沒有建在表的順序欄位上，該表容易發生頁分裂

例如訂單表，有訂單編號orderid，也有客戶編號contactid，那麼聚集索引應該加在哪個欄位上呢？對於該表，訂單編號是順序添加的，如果在orderid上加聚集索引，新增的行都是添加在末尾，這樣不容易經常產生頁分裂。然而，由於大多數查詢都是根據客戶編號來檢查的，因此，將聚集索引加在contactid上才有意義。而contactid對於訂單表而言，並非順序欄位。

例如「張三」的「contactid」是001，那麼「張三」的訂單資訊必須都放在這張表的第一個資料頁上，如果今天「張三」新下了一個訂單，那該訂單資訊不能放在表格的最後一頁，而是第一頁！如果第一頁放滿了呢？很抱歉，表格所有資料都要往後移動為這條記錄騰地方。

SQL Server的索引和Oracle的索引是不同的，SQL Server的聚集索引其實是對資料表依照聚集索引欄位的順序進行了排序，相當於oracle的索引組織表。 SQL Server的聚集索引就是表格本身的一種組織形式，所以它的效率是非常高的。也因為此，插入一筆記錄，它的位置不是隨便放的，而是要按照順序放在該放的資料頁，如果那個資料頁沒有空間了，就引起了頁分裂。所以很顯然，聚集索引沒有建在表的順序欄位上，該表容易發生頁分裂。

曾經碰到過一個情況，一位哥們的某張表重建索引後，插入的效率大幅下降了。估計情況大概是這樣的。該表的聚集索引可能沒有建在表的順序欄位上，該表經常被歸檔，所以該表的資料是以一種稀疏狀態存在的。例如張三下過20張訂單，而最近3個月的訂單只有5張，歸檔策略是保留3個月數據，那麼張三過去的15張訂單已經被歸檔，留下15個空位，可以在insert發生時重新被利用。在這種情況下由於有空位可以利用，就不會發生頁分裂。但是查詢效能會比較低，因為查詢時必須掃描那些沒有資料的空位。

重建聚集索引後情況改變了，因為重建聚集索引就是把表中的資料重新排列一遍，原來的空位沒有了，而頁的填充率又很高，插入資料經常要發生頁分裂，所以性能大幅下降。

對於聚集索引沒有建在順序欄位上的資料表，是否要給與比較低的頁填率？是否要避免重建聚集索引？是一個值得考慮的問題！

加上nolock後查詢常發生頁分割的表，容易產生跳讀或重複讀取

加nolock后可以在“插、删、改”的同时进行查询，但是由于同时发生“插、删、改”，在某些情况下，一旦该数据页满了，那么页分裂不可避免，而此时nolock的查询正在发生，比如在第100页已经读过的记录，可能会因为页分裂而分到第101页，这有可能使得nolock查询在读101页时重复读到该条数据，产生“重复读”。同理，如果在100页上的数据还没被读到就分到99页去了，那nolock查询有可能会漏过该记录，产生“跳读”。

上面提到的哥们，在加了nolock后一些操作出现报错，估计有可能因为nolock查询产生了重复读，2条相同的记录去插入别的表，当然会发生主键冲突。

使用like进行模糊查询时应注意

有的时候会需要进行一些模糊查询比如

select*from contact where username like ‘%yue%’

关键词%yue%，由于yue前面用到了“%”，因此该查询必然走全表扫描，除非必要，否则不要在关键词前加%，

数据类型的隐式转换对查询效率的影响

sql server2000的数据库，我们的程序在提交sql语句的时候，没有使用强类型提交这个字段的值，由sql server 2000自动转换数据类型，会导致传入的参数与主键字段类型不一致，这个时候sql server 2000可能就会使用全表扫描。Sql2005上没有发现这种问题，但是还是应该注意一下。

以上是如何寫出高效能的sql的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

解釋酸的特性（原子，一致性，隔離，耐用性）。Apr 16, 2025 am 12:20 AM

ACID屬性包括原子性、一致性、隔離性和持久性，是數據庫設計的基石。 1.原子性確保事務要么完全成功，要么完全失敗。 2.一致性保證數據庫在事務前後保持一致狀態。 3.隔離性確保事務之間互不干擾。 4.持久性確保事務提交後數據永久保存。

MySQL：數據庫管理系統與編程語言Apr 16, 2025 am 12:19 AM

MySQL既是數據庫管理系統（DBMS），也與編程語言緊密相關。 1）作為DBMS，MySQL用於存儲、組織和檢索數據，優化索引可提高查詢性能。 2）通過SQL與編程語言結合，嵌入在如Python中，使用ORM工具如SQLAlchemy可簡化操作。 3）性能優化包括索引、查詢、緩存、分庫分錶和事務管理。

mySQL：使用SQL命令管理數據Apr 16, 2025 am 12:19 AM

MySQL使用SQL命令管理數據。 1.基本命令包括SELECT、INSERT、UPDATE和DELETE。 2.高級用法涉及JOIN、子查詢和聚合函數。 3.常見錯誤有語法、邏輯和性能問題。 4.優化技巧包括使用索引、避免SELECT*和使用LIMIT。

MySQL的目的：有效存儲和管理數據Apr 16, 2025 am 12:16 AM

MySQL是一種高效的關係型數據庫管理系統，適用於存儲和管理數據。其優勢包括高性能查詢、靈活的事務處理和豐富的數據類型。實際應用中，MySQL常用於電商平台、社交網絡和內容管理系統，但需注意性能優化、數據安全和擴展性。

SQL和MySQL：了解關係Apr 16, 2025 am 12:14 AM

SQL和MySQL的關係是標準語言與具體實現的關係。 1.SQL是用於管理和操作關係數據庫的標準語言，允許進行數據的增、刪、改、查。 2.MySQL是一個具體的數據庫管理系統，使用SQL作為其操作語言，並提供高效的數據存儲和管理。

說明InnoDB重做日誌和撤消日誌的作用。Apr 15, 2025 am 12:16 AM

InnoDB使用redologs和undologs確保數據一致性和可靠性。 1.redologs記錄數據頁修改，確保崩潰恢復和事務持久性。 2.undologs記錄數據原始值，支持事務回滾和MVCC。

在解釋輸出（類型，鍵，行，額外）中要查找的關鍵指標是什麼？Apr 15, 2025 am 12:15 AM

EXPLAIN命令的關鍵指標包括type、key、rows和Extra。 1）type反映查詢的訪問類型，值越高效率越高，如const優於ALL。 2）key顯示使用的索引，NULL表示無索引。 3）rows預估掃描行數，影響查詢性能。 4）Extra提供額外信息，如Usingfilesort提示需要優化。

在解釋中使用臨時狀態以及如何避免它是什麼？Apr 15, 2025 am 12:14 AM

Usingtemporary在MySQL查詢中表示需要創建臨時表，常見於使用DISTINCT、GROUPBY或非索引列的ORDERBY。可以通過優化索引和重寫查詢避免其出現，提升查詢性能。具體來說，Usingtemporary出現在EXPLAIN輸出中時，意味著MySQL需要創建臨時表來處理查詢。這通常發生在以下情況：1)使用DISTINCT或GROUPBY時進行去重或分組；2)ORDERBY包含非索引列時進行排序；3)使用複雜的子查詢或聯接操作。優化方法包括：1)為ORDERBY和GROUPB

See all articles