MySQL「自古以來」都有一個神祕的HANDLER指令,而此指令非SQL標準語法,可以降低最佳化器對於SQL語句的解析與最佳化開銷,進而提升查詢效能。看到這裡,可能有小夥伴不淡定了,這麼好的東西為啥沒廣泛使用呢?這不是跟幾年前很夯的handlersocket插件類似嗎?
那麼,我們先來看看Handler語法說明:
HANDLER tbl_name OPEN [ [AS] alias]
HANDLER tbl_name READ index_name { = | = | } (value1,value2,…) [ WHERE where_condition ] [LIMIT … ]
HANDLER tbl_name READ index_name { FIRST | NEXT | PREV | LAST } [ WHERE where_condition ] [LIMIT … ]
HANDLER tbl_name READ { FIRST | NEXT } [ WHERE where_condition ] [LIMIT … ]
HANDLER tbl_name CLOSE
首先從語法上看,HANDLER可以透過指定的索引去存取資料。但此語法並不支援DML操作。此外,由於減少了SQL解析,Handler指令的效能真的非常不錯,根據Inside君的簡單主鍵測試,Handler指令比SQL快40%~45%。測試腳本如下:
SET @id=FLOOR(RAND()*1000000); HANDLER sbtest.sbtest1 OPEN AS c; HANDLER C READ `PRIMARY` = (@id); HANDLER C CLOSE;
在Inside君的24C的測試伺服器上,64線程主鍵查詢跑到了近37W QPS,還是非常令人印象深刻的。比較SQL的SELECT查詢,整體測試結果如下圖所示:
指令HANDLER的主要實現在源碼sql_handler.h、sql_handler.cc,設個斷點就能觀察到具體的流程。 MySQL上層及InnoDB儲存引擎層主要實作函數入口為:
程式碼如下:
Sql_cmd_handler_open::execute
Sql_cmd_handler_read::execute
Sql_cmd_handler_close::execute
ha_innobase::init_table_handle_for_HANDLER
ha_partition::init_table_handle_for_HANDLER()(7版本支援HANDLER操作分區表)
既然性能不錯,為什麼在生產環境中並不看到命令HANDLER的使用呢?主要是因為HANDLER指令有以下幾個主要問題:
非一致性讀取? ? ?
傳回聚集索引中的所有欄位(即使是二級索引存取),而不能傳回某個特定欄位
二級索引不使用LIMIT關鍵字,只能傳回1行記錄
知道命令HANDLER的同學,可能會認為HANDLER讀取存在髒讀問題。因為MySQL官方文件對於HANDLER讀取的說明就是這麼說的:
The handler interface does not have to provide a consistent look of the data (for example, dirty reads are permitted), so the storage engine can use optimizations that SELECT does not normally permit.
然而需要特別注意的是,MySQL文件中準確的說法是可以允許提供不一致的讀取。但InnoDB儲存引擎的HANDLER實作是支援一致性讀取的,Inside君親測的確不存在髒讀問題。當然,原始碼說明一切,可以發現在函數init_table_handle_for_HANDLER會對READVIEW進行分配,而註解也說明了這一點:
if the trx isolation level would have been specified as SERIALIZABLE */
m_prebuilt->select_lock_type = LOCK_NONE;
m_prebuilt->stored_select_lock_type = LOCK_NONE;