插入到沒有自動增量主鍵的大型 MySQL 表中非常慢

Question

我最近注意到完成簡單INSERT語句所需的時間差異顯著增加。雖然這些語句平均需要大約11毫秒，但有時可能需要10-30秒，我甚至注意到它們的執行時間超過5分鐘。 MySQL版本是8.0.24，運行在WindowsServer2016上。據我所知，伺服器的資源從未過載。伺服器有充足的CPU開銷可供使用，並為其分配了32GB的RAM。這是我正在使用的表：CREATETABLE`saved_segment

P粉022140576 · Answer

我會帶著這個答案冒險。

假設

innodb_buffer_pool_size 的值略小於 20MB，且
#每秒 1K 個選擇隨機到達表格的各個部分，然後

系統最近變得受 I/O 限制，因為下一個 Select 所需的「下一個」區塊越來越經常不會緩存在 buffer_pool 中。

簡單的解決方案是獲取更多 RAM 並提高該可調參數的設定。但表格只會成長到您購買的下一個限制。

相反，這裡有一些部分解決方案。

如果數字不太大，前兩列可能是INT UNSIGNED（4 個位元組而不是8），甚至可能是 MEDIUMINT UNSIGNED（3 個位元組））。注意 ALTER TABLE 會長時間鎖定表。
這些開始和結束時間看起來像是帶有小數秒的時間戳，且始終為「.000」。 DATETIME 和 TIMESTAMP 佔用 5 個位元組（而不是 8 個位元組）。
您的範例顯示經過時間為 0。如果 (end-start) 通常非常小，那麼儲存經過時間而不是結束時間會進一步縮小資料。（但是使用結束時間會讓事情變得混亂）。
您提供的範例資料看起來「連續」。這與自動增量的效率差不多。這是常態嗎？如果不是，INSERT 可能是 I/O 抖動的一部分。
您建議添加人工智慧以及二級索引，這使得插入的工作量增加了一倍；所以我不推薦它。

更多

是的，情況就是這樣。

將其作為 INDEX，或者更好的是，作為 PRIMARY KEY 的開頭，可以為您的兩個查詢提供最佳幫助：

(recording_id, index)

回覆:

SELECT  TRUE
FROM    saved_segment
WHERE   recording_id = ? AND `index` = ?

如果它用於控制其他一些 SQL，請考慮將其添加到其他 SQL 中：

... EXISTS ( SELECT 1
        FROM    saved_segment
        WHERE   recording_id = ? AND `index` = ? ) ...

該查詢（無論哪種形式）都需要您已有的內容

PRIMARY KEY(recording_id, index)

您的其他查詢需求

INDEX(recording_id, start_filetime)

所以，加入索引，或...

更好...這個組合對於兩者來說都更好SELECT：

PRIMARY KEY(recording_id, start_filetime, index).
INDEX(recording_id, index)

有了這個組合，

單行存在性檢查將「使用索引」執行，因為它是「覆蓋」。
另一個查詢將找到在 PK 上聚集在一起的所有相關行。
（PK 有這3 列，因為它需要是唯一的。它們按這個順序排列有利於您的第二個查詢。而且它是PK，而不僅僅是一個INDEX，因此它不需要在索引的BTree 之間反彈和數據的BTree。）
「叢集」可以透過減少此類查詢所需的磁碟區塊數量來提高效能。這會減少 buffer_pool 中的“顛簸”，從而減少增加 RAM 的需要。
我的索引建議大部分與我的資料類型建議正交。

插入到沒有自動增量主鍵的大型 MySQL 表中非常慢

全部回覆(1)我來回復