索引規約


1. 【強制】業務上具有唯一特性的字段,即使是組合字段,也必須建成唯一索引。

說明:不要以為唯一索引影響了insert 速度,這個速度損耗可以忽略,但提高查找速度是明顯的; 另外,即使在應用層做了非常完善的校驗控制,只要沒有唯一索引,根據墨菲定律,必然有髒數據產生。


2. 【強制】 超過三個表格禁止 join 。需要 join 的字段,資料類型保持絕對一致 ; 多表關聯查詢時,保證被關聯的字段需要有索引。

說明:即使雙表 join 也要注意資料表索引、 SQL 效能。


3. 【強制】在varchar 欄位上建立索引時,必須指定索引長度,沒必要對全欄位建立索引,根據實際文字區分度決定索引長度。

說明:索引的長度與區分度是一對矛盾體,一般對字串類型數據,長度為20 的索引,區分度會高達90 %以上,可以使用count(distinct left( 列名, 索引長度)) / count( * ) 的區分度來決定。


4. 【強制】頁面搜尋嚴禁左模糊或全模糊,如果需要請走搜尋引擎來解決。

說明:索引檔案具有 B - Tree 的最左前綴匹配特性,如果左邊的值未確定,那麼無法使用此索引。


5. 【推薦】如果有 order by 的場景,請注意利用索引的有序性。 order by 最後的欄位是組合索引的一部分,並且放在索引組合順序的最後,避免出現 file _ sort 的情況,影響查詢效能。

正例: where a =?  and b =?  order by c; 索引: a _ b _ c

反例:索引中有範圍查找,那麼索引有序性無法利用,如: WHERE a >10  ORDER BY b; 索引a _ b 無法排序。


6. 【建議】利用覆寫索引來進行查詢操作,以避免回表操作。

說明:如果一本書需要知道第 11 章是什麼標題,會翻開第 11 章對應的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。

正例:能夠建立索引的種類:主鍵索引、唯一索引、普通索引,而覆蓋索引是一種查詢的一種效果,用explain 的結果, extra 列會出現: using index 。


7. 【推薦】利用延遲關聯或子查詢優化超多分頁場景。

說明: MySQL 不是跳過offset 行,而是取offset N 行,然後返回放棄前offset 行,返回N 行,那當offset 特別大的時候,效率就非常的低下,要么控制返回的總頁數,要么對超過特定閾值的頁數進行SQL 改寫。

正例:先快速定位需要取得的id 段,然後再關聯:

SELECT a.* FROM 表1 a, (select id from表1 where 條件LIMIT 100000,20 ) b where a.id=b.id


8. 【推薦】  SQL 效能最佳化的目標:至少要達到 range 級別,要求是ref 級別,如果可以是consts

最好。

說明:

1 )consts 單表中最多只有一個符合行 ( 主鍵或唯一索引 ) ,在最佳化階段即可讀取到資料。

2 )ref 指的是使用普通的索引 (normal index) 。

3 )range 對索引進行範圍檢索。

反例: explain 表的結果, type = index ,索引物理檔案全掃描,速度非常慢,這個index 級別比較range 還低,與全表掃描是小巫見大巫。


9. 【推薦】建立組合索引的時候,區分度最高的在最左邊。

正例:如果 where a =?  and b =? , a 列的幾乎接近唯一值,那麼只需要單建 idx _ a 索引即可。

說明:存在非等號和等號混合判斷條件時,在建立索引時,請先將等號條件的列前置。如: where a >?and b =? 那麼即使 a 的區分度較高,也必須把 b 放在索引的最前面。


10. 【參考】建立索引時避免有下列極端誤解:

1 ) 誤認為一個查詢就需要建立一個索引。

2 ) 誤以為索引會消耗空間、嚴重拖曳更新和新增速度。

3 ) 誤以為唯一索引一律需要在應用層以「先查後插」方式解決。