MySQL中join語句如何最佳化-mysql教程-PHP中文網

首頁

資料庫

mysql教程

MySQL中join語句如何最佳化

PHPz

Jun 03, 2023 am 09:31 AM

mysqljoin

Simple Nested-Loop Join

我們來看看當進行 join 操作時，mysql是如何運作的。常見的 join 方式有哪些？

MySQL中join語句如何最佳化

如圖，當我們進行連接操作時，左邊的表是驅動表，右邊的表是被驅動表

Simple Nested-Loop Join 這種連接操作是從驅動表中取出一筆記錄然後逐條匹配被驅動表的記錄，如果條件匹配則將結果傳回。接著，繼續匹配驅動表的下一筆記錄，直到驅動表的所有資料都被匹配完

#因為每次從驅動表取資料比較耗時，所以MySQL並沒有採用這個演算法來進行連線操作

Block Nested-Loop Join

MySQL中join語句如何最佳化

#為了避免每次從驅動程式表取資料耗時，我們可以將一批資料會一次從驅動表取出，並在記憶體中進行匹配操作。這批資料匹配完畢，再從驅動表中取一批資料放到記憶體中，直到驅動表的資料全都匹配完畢

批量取資料能減少很多IO操作，因此執行效率比較高，這種連接操作也被MySQL採用

對了，這塊內存在MySQ中有一個專有的名詞，叫做join buffer，我們可以執行以下語句查看join buffer 的大小

show variables like &#39;%join_buffer%&#39;

MySQL中join語句如何最佳化

把我們之前用的single_table 表搬出來，基於single_table 表建立2個表，每個表插入1w個隨機記錄

CREATE TABLE single_table (
    id INT NOT NULL AUTO_INCREMENT,
    key1 VARCHAR(100),
    key2 INT,
    key3 VARCHAR(100),
    key_part1 VARCHAR(100),
    key_part2 VARCHAR(100),
    key_part3 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    KEY idx_key1 (key1),
    UNIQUE KEY idx_key2 (key2),
    KEY idx_key3 (key3),
    KEY idx_key_part(key_part1, key_part2, key_part3)
) Engine=InnoDB CHARSET=utf8;

create table t1 like single_table;
create table t2 like single_table;

如果直接使用join 語句，MySQL優化器可能會選擇表t1 或t2 作為驅動表，這會影響我們分析sql語句的過程，所以我們用straight_join 讓mysql使用固定的連接方式執行查詢

select * from t1 straight_join t2 on (t1.common_field = t2.common_field)

運行時間為0.035s

MySQL中join語句如何最佳化

執行計劃如下

MySQL中join語句如何最佳化

在Extra列中看到了Using join buffer ，說明連接操作是基於Block Nested -Loop Join 演算法

Index Nested-Loop Join

#了解了Block Nested-Loop Join 演算法之後，可以看到驅動表的每個記錄會把被驅動表的所有記錄都配對一遍，非常耗時，能不能提升一下被驅動表匹配的效率呢？

估計這種演算法你也想到了，就是為被驅動表連接的列加上索引，這樣匹配的過程就非常快，如圖所示

MySQL中join語句如何最佳化

我們來看看基於索引列進行連線執行查詢有多快？

select * from t1 straight_join t2 on (t1.id = t2.id)

執行時間為0.001秒，可以看到比基於普通的列進行連接快了不止一個檔次

MySQL中join語句如何最佳化

執行計劃如下

MySQL中join語句如何最佳化

驅動表的記錄並不是所有列都會被放到join buffer，只有查詢清單中的列和篩選條件中的列才會被放入join buffer，因此我們不要把* 作為查詢列表，只需要把我們關心的列放到查詢列表就好了，這樣可以在join buffer 中放置更多的記錄

如何選擇驅動表？

知道了 join 的具體實現，我們來聊一個常見的問題，即如何選擇驅動表？

如果是Block Nested-Loop Join 演算法：

#當join buffer 夠大時，誰做驅動表沒有影響
#當join buffer 不夠大時，應該選擇小表做驅動表（小表資料量少，放入join buffer 的次數少，減少表的掃描次數）

如果是Index Nested-Loop Join 演算法

假設驅動程式表的行數是M，因此需要掃描驅動表M行

每次從被驅動表中取得一行資料時，需要先尋找索引a，然後再尋找主鍵索引。被驅動表的行數為N。每次搜尋一顆樹近似複雜度是以2為底N的對數，所以在被驅動表上查一行的時間複雜度是2 ∗ l o g 2 N 2*log2^N 2∗log2N

驅動表的每一行資料都要到被驅動表上搜尋一次，整個執行過程近似複雜度為M M ∗ 2 ∗ l o g 2 N M M*2*log2^N M M∗2∗log2N

顯然M對掃描行數影響更大，因此應該讓小表做驅動表。當然這個結論的前提是可以使用被驅動表的索引

總而言之，我們讓小表做驅動表即可

當join 語句執行的比較慢時，我們可以透過以下方法來進行最佳化

進行連接操作時，能使用被驅動表的索引
#小表來做驅動表
增大join buffer 的大小
不要用* 作為查詢列表，只回傳需要的列

以上是MySQL中join語句如何最佳化的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：亿速云。如有侵權，請聯絡admin@php.cn刪除

您如何處理MySQL中的數據庫升級？Apr 30, 2025 am 12:28 AM

MySQL數據庫升級的步驟包括：1.備份數據庫，2.停止當前MySQL服務，3.安裝新版本MySQL，4.啟動新版本MySQL服務，5.恢復數據庫。升級過程需注意兼容性問題，並可使用高級工具如PerconaToolkit進行測試和優化。

您可以使用MySQL的不同備份策略是什麼？Apr 30, 2025 am 12:28 AM

MySQL備份策略包括邏輯備份、物理備份、增量備份、基於復制的備份和雲備份。 1.邏輯備份使用mysqldump導出數據庫結構和數據，適合小型數據庫和版本遷移。 2.物理備份通過複製數據文件，速度快且全面，但需數據庫一致性。 3.增量備份利用二進制日誌記錄變化，適用於大型數據庫。 4.基於復制的備份通過從服務器備份，減少對生產系統的影響。 5.雲備份如AmazonRDS提供自動化解決方案，但成本和控制需考慮。選擇策略時應考慮數據庫大小、停機容忍度、恢復時間和恢復點目標。

什麼是mySQL聚類？Apr 30, 2025 am 12:28 AM

MySQLclusteringenhancesdatabaserobustnessandscalabilitybydistributingdataacrossmultiplenodes.ItusestheNDBenginefordatareplicationandfaulttolerance,ensuringhighavailability.Setupinvolvesconfiguringmanagement,data,andSQLnodes,withcarefulmonitoringandpe

如何優化數據庫架構設計以在MySQL中的性能？Apr 30, 2025 am 12:27 AM

在MySQL中優化數據庫模式設計可通過以下步驟提升性能：1.索引優化：在常用查詢列上創建索引，平衡查詢和插入更新的開銷。 2.表結構優化：通過規範化或反規範化減少數據冗餘，提高訪問效率。 3.數據類型選擇：使用合適的數據類型，如INT替代VARCHAR，減少存儲空間。 4.分區和分錶：對於大數據量，使用分區和分錶分散數據，提升查詢和維護效率。

您如何優化MySQL性能？Apr 30, 2025 am 12:26 AM

tooptimizemysqlperformance，lofterTheSeSteps：1）inasemproperIndexingTospeedUpqueries，2）使用ExplaintplaintoAnalyzeandoptimizequeryPerformance，3）ActiveServerConfigurationStersLikeTlikeTlikeTlikeIkeLikeIkeIkeLikeIkeLikeIkeLikeIkeLikeNodb_buffer_pool_sizizeandmax_connections，4）

如何使用MySQL的函數進行數據處理和計算Apr 29, 2025 pm 04:21 PM

MySQL函數可用於數據處理和計算。 1.基本用法包括字符串處理、日期計算和數學運算。 2.高級用法涉及結合多個函數實現複雜操作。 3.性能優化需避免在WHERE子句中使用函數，並使用GROUPBY和臨時表。

MySQL批量插入數據的高效方法Apr 29, 2025 pm 04:18 PM

MySQL批量插入数据的高效方法包括：1.使用INSERTINTO...VALUES语法，2.利用LOADDATAINFILE命令，3.使用事务处理，4.调整批量大小，5.禁用索引，6.使用INSERTIGNORE或INSERT...ONDUPLICATEKEYUPDATE，这些方法能显著提升数据库操作效率。

給MySQL表添加和刪除字段的操作步驟Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

See all articles