InnoDB引擎有幾個重點特性,為其帶來了更好的效能和可靠性:
今天我們的主題就是插入緩衝(Insert Buffer)
,由於InnoDB引擎底層資料儲存結構式B 樹,而對於索引我們又有聚集索引和非聚集索引。
在進行資料插入時必然會引起索引的變化,聚集索引不必說,一般都是遞增有序的。而非聚集索引就不一定是什麼資料了,其離散性導致了在插入時結構的不斷變化,從而導致插入性能降低。
所以為了解決非聚集索引插入效能的問題,InnoDB引擎 創造了Insert Buffer。
看到上圖,可能大家會認為Insert Buffer 就是InnoDB 緩衝池的一個組成部分。
**重點:**其實對也不對,InnoDB 緩衝池確實包含了Insert Buffer的信息,但Insert Buffer 其實和資料頁一樣,也是物理存在的(以B 樹的形式存在共享表空間中)。
先說幾個點:
一張表格只能有一個主鍵索引,那是因為其實體儲存是一個B 樹。 (別忘了聚集索引葉子節點儲存的數據,而資料只有一份)
非聚集索引葉子節點存的是聚集索引的主鍵
首先我們知道在InnoDB儲存引擎中,主鍵是行唯一的識別碼(也就是我們常叨叨的聚集索引)。我們平時插入資料一般都是按照主鍵遞增插入,因此聚集索引都是順序的,不需要磁碟的隨機讀取。
例如表:
CREATE TABLE test( id INT AUTO_INCREMENT, name VARCHAR(30), PRIMARY KEY(id) );复制代码
如上我創建了一個主鍵id,它有以下的特性:
一般情況下由於聚集索引的有序性,不需要隨機讀取頁中的數據,因為此類別的順序插入速度是非常快的。
但如果你把列 Id 插入UUID這種數據,那你插入就是和非聚集索引一樣都是隨機的了。會導致你的B tree結構不停地變化,那性能必然會受到影響。
很多時候我們的表格還會有很多非聚集索引,例如我依照b欄位查詢,且b欄位不是唯一的。如下表:
CREATE TABLE test( id INT AUTO_INCREMENT, name VARCHAR(30), PRIMARY KEY(id), KEY(name) );复制代码
這裡我建立了一個x表,它有以下特點:
非聚集索引也是一顆B 樹,只是葉子節點存的是聚集索引的主鍵和name 的值。
因為不能保證name列的資料是順序的,所以非聚集索引這棵樹的插入必然也不是順序的了。
當然如果name列插入的是時間類型數據,那麼其非聚集索引的插入也是順序的。
可以看出非聚集索引插入的離散性導致了插入效能的下降,因此InnoDB引擎設計了Insert Buffer來提高插入效能。
我來看看使用Insert Buffer 是怎麼插入的:
#首先對於非聚集索引的插入或更新操作,不是每一次直接插入索引頁中,而是先判斷插入的非聚集索引頁是否在緩衝池中。
若在,則直接插入;若不在,則先放入到一個Insert Buffer物件中。
給外部的感覺好像是樹已經插入非聚集的索引的葉子節點,而其實是存放在其他位置了
以一定的頻率和情況進行Insert Buffer和輔助索引頁子節點的merge(合併)操作,通常會將多個插入操作一起進行merge,這就大大的提升了非聚集索引的插入效能。
只有满足上面两个必要条件时,InnoDB存储引擎才会使用Insert Buffer来提高插入性能。
那为什么必须满足上面两个条件呢?
第一点索引是非聚集索引就不用说了,人家聚集索引本来就是顺序的也不需要你
第二点必须不是唯一(unique)的,因为在写入Insert Buffer时,数据库并不会去判断插入记录的唯一性。如果再去查找肯定又是离散读取的情况了,这样InsertBuffer就失去了意义。
我们可以使用命令SHOW ENGINE INNODB STATUS来查看Insert Buffer的信息:
------------------------------------- INSERT BUFFER AND ADAPTIVE HASH INDEX ------------------------------------- Ibuf: size 7545, free list len 3790, seg size 11336, 8075308 inserts,7540969 merged sec, 2246304 merges ...复制代码
使用命令后,我们会看到很多信息,这里我们只看下INSERT BUFFER 的:
seg size 代表当前Insert Buffer的大小 11336*16KB
free listlen 代表了空闲列表的长度
size 代表了已经合并记录页的数量
Inserts 代表了插入的记录数
merged recs 代表了合并的插入记录数量
merges 代表合并的次数,也就是实际读取页的次数
merges:merged recs大约为1∶3,代表了Insert Buffer 将对于非聚集索引页的离散IO逻辑请求大约降低了2/3
说了这么多针对于Insert Buffer的好处,但目前Insert Buffer也存在一个问题:
即在写密集的情况下,插入缓冲会占用过多的缓冲池内存(innodb_buffer_pool),默认最大可以占用到1/2的缓冲池内存。
占用了过大的缓冲池必然会对其他缓冲池操作带来影响
MySQL5.5之前的版本中其实都叫做Insert Buffer,之后优化为 Change Buffer
可以看做是 Insert Buffer 的升级版。
插入缓冲( Insert Buffer)这个其实只针对 INSERT 操作做了缓冲,而Change Buffer 对INSERT、DELETE、UPDATE都进行了缓冲,所以可以统称为写缓冲,其可以分为:
Insert Buffer
Delete Buffer
Purgebuffer
Insert Buffer到底是个什么?
其实Insert Buffer的数据结构就是一棵B+树。
在MySQL 4.1之前的版本中每张表有一棵Insert Buffer B+树
目前版本是全局只有一棵Insert Buffer B+树,负责对所有的表的辅助索引进行Insert Buffer
这棵B+树存放在共享表空间ibdata1中
以下几种情况下 Insert Buffer会写入真正非聚集索引,也就是所说的Merge Insert Buffer
一句话概括下:
Insert Buffer 就是用于提升非聚集索引页的插入性能的,其数据结构类似于数据页的一个B+树,物理存储在共享表空间ibdata1中 。
相关免费学习推荐:mysql视频教程
以上是介紹重要知識點:InnoDB的插入緩衝的詳細內容。更多資訊請關注PHP中文網其他相關文章!