MySQL中读页缓冲区buffer pool的知识点有哪些-mysql教程-PHP中文网

首页

数据库

mysql教程

MySQL中读页缓冲区buffer pool的知识点有哪些

王林

Jun 03, 2023 am 10:40 AM

mysqlbuffer pool

Buffer pool

我们都知道，在读取页面时，需要先将页面从磁盘读取到内存中，然后等待CPU对数据进行处理。我们直到从磁盘中读取数据到内存的过程是十分慢的，所以我们读取的页面需要将其缓存起来，所以MySQL有这个buffer pool对页面进行缓存。

首先MySQL在启动时会向操作系统申请一段连续的内存空间，这一段空间就是作为buffer pool所用。将缓存的页放入buffer pool中管理起来。

mysql> show variables like &#39;innodb_buffer_pool_size&#39;;
+-------------------------+-----------+
| Variable_name           | Value     |
+-------------------------+-----------+
| innodb_buffer_pool_size | 134217728 |
+-------------------------+-----------+
1 row in set, 1 warning (0.00 sec)

我们可以看到默认是134217728字节，即128MB。若我们申请的缓存区大小是16KB的倍数，则不会出现碎片问题，因为每个页面大小都是16KB。

buffer pool组成

每个页面都包含其对应的控制块信息，这些信息存储在buffer pool中。每个控制块对应管理每一个页面 (我们使用地址引用每一个页面) ，控制块用来存储页面的一些信息，控制块的占用大小不包括在innodb_buffer_pool_size中。由MySQL在启动时自己额外申请空间。

MySQL中读页缓冲区buffer pool的知识点有哪些

由于无法充分利用空间，控制块和缓存页之间会存在一些不规则的碎片。因为MySQL向操作系统申请的内存空间需要申请一定大小的控制块空间，不能确定具体的大小，难免回有无法利用的空间。

free链表

free链表顾名思义，就是管理空闲的缓存页的链表，如果缓存页没有被使用，其控制块就会连接到free链表上。

MySQL中读页缓冲区buffer pool的知识点有哪些

通过一个基节点连接控制块形成一个free链表，并存储空闲页的数量等基本信息。

当我们从磁盘读取一个页到buffer pool中，就会取一个空闲的控制块填上对应缓存页的基本信息。

缓存页的哈希处理

MySQL在buffer pool中怎么快速存取一个页，以及查看对应页有没有被缓存到buffer pool中呢？

这就是用到哈希表，在Java中就是hashmap，通过表空间+页号做处理形成一个hash的key值，然后value值就是缓存页在buffer pool中的地址。

flush链表的管理

学习到这一章节的时候我震惊了，首先确实和我的理解是不一样的，以及到后面的MVCC确实让我大开眼界，这是我学习一遍后回头做的总结，所以比较言简意赅哈。

我们使用SQL语句对某条记录进行修改的时候，就会修改某个页面或者多个页面，我们对于页面的修改呢，并不会直接对磁盘进行对应的修改，因为对于磁盘IO实在是太慢了，我们首先会将修改的页面（简称脏页）链起来，就和free链表差不多，就是一个基节点将对应脏页的控制块连接在一起。

这个flush链表就代表我们即将还没有将页面更新到磁盘的链表。

MySQL中读页缓冲区buffer pool的知识点有哪些

LRU链表

因为buffer pool的大小是有限的，所以我们对于缓存页的大小是有限的，所以我们需要将不用的页面进行一个淘汰。MySQL采用的就是LRU的方式进行淘汰。

LRU就是最久未使用淘汰的策略，我们使用一个链表将缓存页面链起来，最近访问的出现在最前面，最久未访问的在链表末尾，当LRU满了新页面都进来机会淘汰链表尾部页面。

我们直接使用LRU，当MySQL进行预读或者全表扫描出现大量低频页面被读进LRU链表，会导致高频的页面直接被淘汰掉了，取而代之的是一些不经常用的页面。

MySQL优化器会将预计会被查询访问的页面预先加载到内存buffer pool中，以便提高查询性能。可以分为两种：

线性预读

当读取一个区的页面超过系统变量innodb_read_ahead_threshold的值默认为56，也就是说当我们读取一个区的页面超过56页，MySQL就会异步的读取下一个区的所有页面到内存中。

随机预读

如果buffer pool已经缓存了某个区的13个页面，不管是不是顺序的，只要有13页缓存了，就会触发MySQL异步读取本区的所有页面到MySQL中。系统变量innodb_random_read_ahead可以被设置为关闭随机预读。默认是OFF。

所以出现了改进基于分区的LRU链表，将链表分为两份。

一个是使用频率非常高的young区域，一个是使用频率不是很高的old区。

正常来说old区占比是37％，所以young区就占63％，我们可以通过innodb_old_blocks_pct来修改，默认就是37。

我们来讲讲这个基于分区的LRU链表。

首先buffer pool初始化，会将读取的页面直接放进old区。

但是如果我们对于同一个页面的多条记录进行访问的话，我们就会多次访问同一页多次。但是如果我们是全表扫描的话，是可能会将所有页面缓存进缓存池中的，所以MySQL对于其进行优化。

所以MySQL对于当页面第一次读入old区并在一定时间间隔（innodb_old_blocks_pct）内的多次访问来说是不会将其放入young区进行缓存的。innodb_old_blocks_pct的值默认为1000，就是刚来的来一秒内的多次访问是不会将其转移到young区的。

如果多次访问就会将old区的页升级到young区。当young区的页面被访问，只有young链表后1/4的页面被访问时才会将其转置到young区链表头，不然就不会改动，减少一些调整链表的性能损失。

刷新脏页

MySQL会启动后台线程进行脏页，也就是修改的页面进行刷新到磁盘。

以下有两种方式刷新脏页：

从LRU的尾部扫描一些页面，刷新其中的脏页到磁盘中。

在LRU链表的old区域尾部，即不经常使用的页面中，后台线程会查找是否存在脏页，如果有，则将其更新至磁盘。控制扫描区域尾部数量的方法是更改系统变量innodb_lru_scan_depth。

从flush链表中更新到磁盘。

我们上面说了flush连接这脏页的控制块，我们就可以将连接这flush链表的脏页进行更新。

疑问：为什么要两种方式更新呢？我刚开始不懂这是我回过头来看的时候就懂了

首先我们脏页是缓存在buffer pool中的，但是我们buffer pool空间是有限的，又因为我们使用的是LRU的方式，又因为从flush链表将脏页同步到磁盘效率实在不高，所以不会很经常去更新脏页。如果我们不更新直接将其从LRU的链表抛弃也就是从缓存池中直接扔了，但是它是脏页就无法同步到磁盘了，同时flush链表链接的也会出现问题。

所以在LRU淘汰很久未使用的页有个前提就是它不是一个脏页。为了淘汰这些页面，我们需要检查LRU链表的末尾是否存在脏页并进行更新。

flush链表更新那就是它的本职工作了，它存这个也是干这个的，应该没有什么问题。

当系统十分繁忙，buffer pool使用量不足的时候，因为磁盘IO太慢了，所以会出现一种情况，就是大量的用户线程也在进行这个同步脏页的活。如果未进行脏页同步并淘汰缓冲池的页面，则无法读取该页面。

多个buffer pool实例

我们可以设置多个buffer pool来实现多实例提高性能。

mysql> show variables like &#39;innodb_buffer_pool_instances&#39;;
+------------------------------+-------+
| Variable_name                | Value |
+------------------------------+-------+
| innodb_buffer_pool_instances | 1     |
+------------------------------+-------+
1 row in set, 1 warning (0.00 sec)

我们可以设置innodb_buffer_pool_instances系统变量来控制实例变量。

但是当buffer pool的大小小于1G的时候，设置2个实例也是没有用的（会被恢复成1个），多实例的情况是建立在大内存的情况下的。

动态调整buffer pool大小

在MySQL5.7.5后，MySQL中的buffer pool的大小是以chunk来分配了，如下图。

MySQL中读页缓冲区buffer pool的知识点有哪些

一个buffer pool是由多个chunk组成的，所以MySQL向操作系统申请连续的内存空间，就是以chunk的方式来申请的，这样我们可以在MySQL运行时调整buffer pool的大小。在运行时更改chunk大小不可行，并且会造成性能浪费。？

innodb_buffer_pool_size / innodb_buffer_pool_instances = 每个实例buffer pool的大小。

每个实例的大小 / innodb_buffer_pool_chunk_size = 每个实例由多少个chunk构成。

不是弄很明白，怎么动态调整大小，我调整了但是mysqld占用内存大小还是只能重启才能生效，我不会。

查看buffer pool具体的信息

show engine innodb status;

以上是MySQL中读页缓冲区buffer pool的知识点有哪些的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：亿速云。如有侵权，请联系admin@php.cn删除

MySQL的许可与其他数据库系统相比如何？Apr 25, 2025 am 12:26 AM

MySQL使用的是GPL许可证。1）GPL许可证允许自由使用、修改和分发MySQL，但修改后的分发需遵循GPL。2）商业许可证可避免公开修改，适合需要保密的商业应用。

您什么时候选择InnoDB而不是Myisam，反之亦然？Apr 25, 2025 am 12:22 AM

选择InnoDB而不是MyISAM的情况包括：1)需要事务支持，2)高并发环境，3)需要高数据一致性；反之，选择MyISAM的情况包括：1)主要是读操作，2)不需要事务支持。InnoDB适合需要高数据一致性和事务处理的应用，如电商平台，而MyISAM适合读密集型且无需事务的应用，如博客系统。

在MySQL中解释外键的目的。Apr 25, 2025 am 12:17 AM

在MySQL中，外键的作用是建立表与表之间的关系，确保数据的一致性和完整性。外键通过引用完整性检查和级联操作维护数据的有效性，使用时需注意性能优化和避免常见错误。

MySQL中有哪些不同类型的索引？Apr 25, 2025 am 12:12 AM

MySQL中有四种主要的索引类型：B-Tree索引、哈希索引、全文索引和空间索引。1.B-Tree索引适用于范围查询、排序和分组，适合在employees表的name列上创建。2.哈希索引适用于等值查询，适合在MEMORY存储引擎的hash_table表的id列上创建。3.全文索引用于文本搜索，适合在articles表的content列上创建。4.空间索引用于地理空间查询，适合在locations表的geom列上创建。

您如何在MySQL中创建索引？Apr 25, 2025 am 12:06 AM

toCreateAnIndexinMysql，usethecReateIndexStatement.1）forasingLecolumn，使用“ createIndexIdx_lastNameEnemployees（lastName）; 2）foracompositeIndex，使用“ createIndexIndexIndexIndexIndexDx_nameOmplayees（lastName，firstName，firstName）;” 3）forauniqe instex，creationexexexexex，

MySQL与Sqlite有何不同？Apr 24, 2025 am 12:12 AM

MySQL和SQLite的主要区别在于设计理念和使用场景：1.MySQL适用于大型应用和企业级解决方案，支持高性能和高并发；2.SQLite适合移动应用和桌面软件，轻量级且易于嵌入。

MySQL中的索引是什么？它们如何提高性能？Apr 24, 2025 am 12:09 AM

MySQL中的索引是数据库表中一列或多列的有序结构，用于加速数据检索。1）索引通过减少扫描数据量提升查询速度。2）B-Tree索引利用平衡树结构，适合范围查询和排序。3）创建索引使用CREATEINDEX语句，如CREATEINDEXidx_customer_idONorders(customer_id)。4）复合索引可优化多列查询，如CREATEINDEXidx_customer_orderONorders(customer_id,order_date)。5）使用EXPLAIN分析查询计划，避