搜索
首页数据库mysql教程InnoDB表与索引结构相关知识整理

InnoDB表与索引结构相关知识整理

Jun 07, 2016 pm 04:24 PM
innodbmysql数据整理相关知识索引结构

MySQL把表的数据词典信息以.frm文件的形式存在数据库目录里,所有MySQL存储引擎都是这样的。但是每个InnoDB表在表空间内的InnoDB内部数据词典里也有它自己的条目。当MySQL移除表或数据库,它不得不删除.frm文件和InnoDB数据词典内的相应条目。这就是为什么你

MySQL把表的数据词典信息以.frm文件的形式存在数据库目录里,所有MySQL存储引擎都是这样的。但是每个InnoDB表在表空间内的InnoDB内部数据词典里也有它自己的条目。当MySQL移除表或数据库,它不得不删除.frm文件和InnoDB数据词典内的相应条目。这就是为什么你不能在数据库之间简单地移动.frm文件来移动InnoDB表。

1. 聚集索引和第二索引

每个InnoDB有一个叫聚集索引(clustered index)的特殊索引,行的数据被存于其中。

  • 如果你的表定义了主键,主键的索引就是聚集索引。
  • 如果你的表没有主键,MySQL就选择第一个不可为空的唯一索引(UNIQUE)作为主键,并且InnoDB把它作为聚集索引。
  • 如果你的表没有主键,也没有合适的唯一索引,InnoDB内部会在一个包含RowID的合成列上生成一个隐藏的聚集索引,其中是用InnoDB在分配给RowID来排序的。RowID是一个6字节的域,它在新行被插入的时候单调增加。因此被RowID排序的行是物理地按照插入顺序排的。

通过聚集索引访问行速度很快,因为行数据与索引扫描头部在同一数据页上。如果表是巨大的,当对于那些索引与数据放在不同数据页上的方案,聚集索引构架通常更节约磁盘I/O。(比如,MyISAM用一个文件存放数据,另外一个文件存放索引)。

在InnoDB中,非聚集索引里的记录(也称为辅助索引或第二索引)包含对应行的主键值。InnoDB用这个主键值从聚集索引中搜索行。注意,如果主键比较长,第二索引就会使用更多空间,因此最好使用一个比较短的主键。

2. 索引的物理结构

所有InnoDB的索引是B树索引,这种索引记录被存储在树的叶子页上。一个索引页的默认大小是16KB。当新记录被插入,InnoDB会为将来索引记录的插入和更新留下十六分之一的页空间。

如果索引记录以连续的顺序被插入(升序或者降序),结果索引页大约是15/16满。如果记录被以随机的顺序被插入,页面是从1/2到 15/16满。如果索引页的填充因子降到低于1/2,InnoDB会收缩索引树来释放页。

3. 插入缓冲

在数据库应用中,主键是一个唯一的识别符,并且新行被以主键的升序来插入,这是个常见的情况。因此,聚集索引的插入不需要磁盘的随机读。

另一方面,第二索引通常是非唯一的,第二索引的插入顺序也相对随机。这可能会导致大量的随机磁盘I/O操作,而没有一个被用在InnoDB中的专用机制。

如果一个索引记录应该被插入到一个非唯一第二索引,InnoDB检查第二索引页是否在缓冲池中。如果是,InnoDB直接插入到索引页。如果索引页没有在缓冲池中被发现,InnoDB插入记录到一个专门的插入缓冲结构。插入缓冲被保持得如此小以至于它完全适合在缓冲池,并且可以非常快地做插入。

插入缓冲周期性地被合并到数据库中第二索引树里。把数个插入合并到索引树的同一页,节省磁盘I/O操作,经常地这是有可能的。据测量,插入缓冲可以提高到表的插入速度达15倍。

在插入事务被提交之后,插入缓冲合并可能连续发生。实际上,服务器关闭和重启之后,这会连续发生。

当许多第二索引必须被更新,并且许多行已被插入之时,插入缓冲合并可能需要数个小时。在这期间内,磁盘I/O将会增加,这样会导致磁盘约束查询明显缓慢。另一个明显的后台I/O操作是净化(purge)线程。

4. 自适应的哈希索引

如果一个表几乎完全缓存在主内存中,在其上执行查询最快的方法就是使用哈希索引。InnoDB有一个自动机制,它监视对为一个表定义的索引的索引搜索。如果InnoDB注意到查询会从建立一个哈希索引中获益,它会自动地这么做。

注意,哈希索引总是基于表上已存在的B树索引来建立。根据InnoDB对B树索引观察的搜索方式,InnoDB会在为该B树定义的任何长度的键的一个前缀上建立哈希索引。 哈希索引可以是部分的:它不要求整个B树索引被缓存在缓冲池。InnoDB根据需要对被经常访问的索引的那些页面建立哈希索引。

在某种意义上,InnoDB通过自适应的哈希索引机制来调整自己,使其更加贴近主内存数据库的架构。

5. 物理行结构

InnoDB表的物理行结构取决于表创建时指定的行格式。在MySQL 5.1中,InnoDB默认使用紧凑(COMPACT)格式,但为了保留与旧版本MySQL的兼容性,冗余(REDUNDANT)格式也可用。查看InnoDB表的行格式,可使用SHOW TABLE STATUS命令。

紧凑的行格式大约可减少20%的存储空间,但某些操作会增加CPU使用量。如果是一个典型的受限于高速缓存命中率和磁盘速度的工作负荷,使用紧凑格式可能会更快。如果是一种少见工作负荷情况,由于有限的CPU速度,紧凑格式可能会比较慢。

使用冗余行格式的InnoDB表行具有以下特点:

  • InnoDB中每个索引记录包含一个6字节的头。这个头被用来将连续的记录连接在一起,并且也用在row-level锁定中。
  • 聚集索引里的记录包含所有的用户定义列。此外,还有6个字节的事务ID和一个7个字节的回滚指针。
  • 如果一个表没有定义主键,每个聚集索引记录还包含一个6字节的RowID。
  • 每个第二索引记录包含聚集索引键定义的所有主键列。
  • 一个记录也包含一个指向该记录每个列的指针,如果在一个记录中列的总长度小于128字节,该指针是一个字节;否则就是2字节。这些指针的阵列被称为记录目录。这些指针指向的区域被称为记录的数据部分。
  • 在内部,InnoDB以固定长度格式存储固定长度的字符列,比如CHAR(10)。InnoDB不截断VARCHAR列的尾随空格。
  • 一个SQL的NULL值在记录目录里占1到2字节。例如,在一个可变长度列,如果存的是SQL的NULL值,则在记录数据部分占零字节。在一个固定长度列,记录的数据部分占该列的固定长度。为NULL值保留固定空间的动机是之后该列从NULL值到非NULL值的更新可以就地完成,且不会导致索引页的碎片。

使用紧凑行格式的InnoDB表行具有以下特点:

  • InnoDB中每个索引记录包含一个5字节的头,在此之前是一个可变长度头。这个头被用来将连续的记录连接在一起,并且也用在row-level锁定中。
  • 在记录头的可变长度部分包含一个用来标识NULL列的位向量。如果索引中可为NULL的列的数量为N,则该位向量占用(N+7)/8个字节。NULL列完全不占用这个位向量以外的空间。在头的可变长度部分也包含可变长列的长度。每个长度需要一个或两个字节,这取决于该列的最大长度。如果索引中的所有列都是NOT NULL的并且是固定长度的,记录头就没有可变长度部分。
  • 对于每一个非空的可变长字段,记录头用一个或两个字节保存列长度。两个字节只用在列的一部分数据外部存储在溢出页上或者列最大长度超过255个字节并且实际长度超过127字节的情况下。对于外部存储的列,这两个字节长度表示内部存储部分的长度加上20字节的外部存储指针。例如内部存储部分是768字节,这个长度就是768+20。20字节长的指针存储了列的真实长度。
  • 记录头后紧跟着的是非空列的数据内容。
  • 聚集索引里的记录包含所有的用户定义列。此外,还有6个字节的事务ID和一个7个字节的回滚指针。
  • 如果一个表没有定义主键,每个聚集索引记录还包含一个6字节的RowID。
  • 每个第二索引记录也包含为聚集索引键定义的所有主键列。如果任何主键字段是可变长的,则每一个第二索引的记录头必须有一个可变长部分来记录这些可变长列的长度,即使第二索引是建立在固定长的列上。
  • 在内部,InnoDB以固定长度格式存储固定长度、固定宽度的字符列,如CHAR(10)。InnoDB不截断VARCHAR列的尾随空格。
  • 在内部,InnoDB会将UTF-8的CHAR(N)的列存储在N字节里,并截断尾随空格。(如果冗余行格式,这样的列会占据3 ×N字节。 )在许多情况下,保留最低限度的空间N可以保持列在更新时不会造成索引碎片。
声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
解释InnoDB缓冲池及其对性能的重要性。解释InnoDB缓冲池及其对性能的重要性。Apr 19, 2025 am 12:24 AM

InnoDBBufferPool通过缓存数据和索引页来减少磁盘I/O,提升数据库性能。其工作原理包括:1.数据读取:从BufferPool中读取数据;2.数据写入:修改数据后写入BufferPool并定期刷新到磁盘;3.缓存管理:使用LRU算法管理缓存页;4.预读机制:提前加载相邻数据页。通过调整BufferPool大小和使用多个实例,可以优化数据库性能。

MySQL与其他编程语言:一种比较MySQL与其他编程语言:一种比较Apr 19, 2025 am 12:22 AM

MySQL与其他编程语言相比,主要用于存储和管理数据,而其他语言如Python、Java、C 则用于逻辑处理和应用开发。 MySQL以其高性能、可扩展性和跨平台支持着称,适合数据管理需求,而其他语言在各自领域如数据分析、企业应用和系统编程中各有优势。

学习MySQL:新用户的分步指南学习MySQL:新用户的分步指南Apr 19, 2025 am 12:19 AM

MySQL值得学习,因为它是强大的开源数据库管理系统,适用于数据存储、管理和分析。1)MySQL是关系型数据库,使用SQL操作数据,适合结构化数据管理。2)SQL语言是与MySQL交互的关键,支持CRUD操作。3)MySQL的工作原理包括客户端/服务器架构、存储引擎和查询优化器。4)基本用法包括创建数据库和表,高级用法涉及使用JOIN连接表。5)常见错误包括语法错误和权限问题,调试技巧包括检查语法和使用EXPLAIN命令。6)性能优化涉及使用索引、优化SQL语句和定期维护数据库。

MySQL:初学者的基本技能MySQL:初学者的基本技能Apr 18, 2025 am 12:24 AM

MySQL适合初学者学习数据库技能。1.安装MySQL服务器和客户端工具。2.理解基本SQL查询,如SELECT。3.掌握数据操作:创建表、插入、更新、删除数据。4.学习高级技巧:子查询和窗口函数。5.调试和优化:检查语法、使用索引、避免SELECT*,并使用LIMIT。

MySQL:结构化数据和关系数据库MySQL:结构化数据和关系数据库Apr 18, 2025 am 12:22 AM

MySQL通过表结构和SQL查询高效管理结构化数据,并通过外键实现表间关系。1.创建表时定义数据格式和类型。2.使用外键建立表间关系。3.通过索引和查询优化提高性能。4.定期备份和监控数据库确保数据安全和性能优化。

MySQL:解释的关键功能和功能MySQL:解释的关键功能和功能Apr 18, 2025 am 12:17 AM

MySQL是一个开源的关系型数据库管理系统,广泛应用于Web开发。它的关键特性包括:1.支持多种存储引擎,如InnoDB和MyISAM,适用于不同场景;2.提供主从复制功能,利于负载均衡和数据备份;3.通过查询优化和索引使用提高查询效率。

SQL的目的:与MySQL数据库进行交互SQL的目的:与MySQL数据库进行交互Apr 18, 2025 am 12:12 AM

SQL用于与MySQL数据库交互,实现数据的增、删、改、查及数据库设计。1)SQL通过SELECT、INSERT、UPDATE、DELETE语句进行数据操作;2)使用CREATE、ALTER、DROP语句进行数据库设计和管理;3)复杂查询和数据分析通过SQL实现,提升业务决策效率。

初学者的MySQL:开始数据库管理初学者的MySQL:开始数据库管理Apr 18, 2025 am 12:10 AM

MySQL的基本操作包括创建数据库、表格,及使用SQL进行数据的CRUD操作。1.创建数据库:CREATEDATABASEmy_first_db;2.创建表格:CREATETABLEbooks(idINTAUTO_INCREMENTPRIMARYKEY,titleVARCHAR(100)NOTNULL,authorVARCHAR(100)NOTNULL,published_yearINT);3.插入数据:INSERTINTObooks(title,author,published_year)VA

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)