原文地址:blog.jcole.us/2013/01/03/…
在数据存储模型中,通常有“空间 ”这个概念,在 MySQL 中被称为“ 表空间 ”,有时候在 InnoDB 中也被称为“ 文件空间”。一个空间可能由一个操作系统中的多个理论文件组成(例如 ibdata1, ibdata2 等等),实际上只是一个逻辑文件 – 多个文理文件被当做一个连贯在一起的文件解决。
InnoDB 中每个 空间 都被调配了一个 32 位的无符号整型空间 ID,这个 ID 被用来在不同的中央援用指向这个空间。InnoDB 总是有一个“零碎空间”,他的空间 ID 是 0。零碎空间用于保留 InnoDB 的一系列元数据的记录。通过 MySQL,InnoDB 目前只反对“一个表一个文件”空间模式的额定空间,这将为每一个 MySQL 表创立 .ibd 文件。从外部来看,这个 .ibd 文件理论是一个能够包容多个表的残缺的 空间,然而在 MySQL 的实现中,它只能蕴含一个表。
页
=
每个 空间 被切分成了 页,个别每 页 16 KiB(也能够通过在编译时指定 UNIV_PAGE_SIZE
批改,或者开启了 InnoDB 压缩)。空间 中的 页会被调配一个 32 位的页码,这个页码被称为 偏移 ,其实这个页码就是从 空间 地址结尾的 页偏移 。所以,第 0 页位于文件偏移 0 的地位,第 1 页位于文件偏移 16384 的地位,以此类推。可能这里有些人会想起来,InnoDB 的 数据大小限度是 64 TiB,这个其实是每个 空间 的大小限度。因为页码是一个 32 位的无符号整型,并且默认的页大小是 16 KiB,这样空间最大大小是 2^32 * 16 KiB = 64 TiB
页 的构造如下:
每一页都有一个 38 字节的 FIL
头部和一个 FIL
尾部(FIL
这个名字其实就是出自“file”的简写)。头部蕴含一个示意页类型的字段,这个类型决定了页的剩下局部的构造。FIL
头部和 FIL
尾部构造如下所示:
FIL
头部以及尾部蕴含以下构造:
- 页类型 (2 bytes):这对于解析剩下的页数据是很重要的。很多模块以及场景下须要调配页存储,包含 文件空间治理 , 范畴治理 , 事务零碎 , 数据字段 ,undo log,blobs 数据 还有 索引 以及 表数据。
- 空间 ID(4 bytes)
- 页码 (4 bytes):当 页被初始化的时候页码就被存入了。查看该字段保留的页码与依据文件偏移量读取到的页码是否匹配,有助于表明读取是否是正确的。并且,如果这个字段被初始化了,表明这个 页也被初始化了
- checksum(4 bytes)和 老版 checksum(4 bytes)
- 上一页 (4 bytes)与 下一页 (4 bytes)的指针:这样能够构建双向链表,并用于 索引 页来讲所有页在同一级别链接起来,从而进步索引全扫描的效率。然而有很多页面类型不应用这些字段。
- 头部保留 最近批改对应的 LSN(日志序列号,8 bytes),同时这个序列号的 低 32 位也保留在尾部。
- 全局最大的日志序列号(被称为 flush LSN,8 bytes),真正的序列号只保留在第 0 个空间的第 0 页,其余页这个字段的值都是 0,相当于都复用第 0 个空间的第 0 页的这个字段。这样全局产生批改的时候只用批改一个字段就行了。
空间 文件
一个 空间文件 是很多 页(最多 2^32)的聚合链接,为了更高效的治理,页 被聚合成很多个 1 MiB 大小的块(64 个间断页,默认页大小是 16 KiB),这个块被称为“区”(extent)。很多构造只通过援用 区来在一个 空间 中调配 页
InnoDB 须要做一些元数据记录,来追踪所有 页,区 以及 空间 自身。
空间 中的第一页是 FSP_HDR
(文件空间头页)。FSP_HDR
页蕴含一个 FSP
构造,记录像是 空间的大小 , 闲暇区 、 碎片区 和满区 的列表等数据(未来我会写一篇具体的对于闲暇空间治理介绍的文章)。一页 FSP_HDR
只有够保留 256 个 区(相当于 16384 页 ,256 MiB)信息的空间,所以每 16384 页之后,都须要额定记录这些页信息的空间。XDES
页和 FSP_HDR
页的构造是雷同的,只是在 XDES
中 FSP
占用的存储都是被 0 填充的。这些额定的 页会随着空间文件的增长而主动调配。
INODE
页用来保留文件 段(Segmentation,蕴含一组 区以及一个只会独自调配的碎片区的数组)的列表。每个 INDOE
页能够保留 85 个 INODE
元素,每个索引须要两个 INODE
元素(未来我会写一篇具体的对于 INDOE 元素内容和文件 区的文章)。
IBUF_BITMAP
页保留对于插入缓存的信息,不在本系列的探讨范畴内。
零碎 空间
零碎空间 (第 0 个空间) 比拟非凡,蕴含许多按固定页码调配的页面,以存储对 InnoDB 操作至关重要的大量信息。零碎空间与任何其余空间一样,也须要 FSP_HDR
, IBUF_BITMAP
,Inode
这三个页面作为头三页。这之后,与其余页面有点区别。
- 第 3 页,
SYS
类型:与插入缓存相干的头信息。 - 第 4 页,
INDEX
类型:用于插入缓冲的索引构造的根页。 - 第 5 页,
TRX_SYS
类型:与 InnoDB 事务零碎的操作相干的信息,例如最新的事务 ID、MySQL 二进制日志信息和双写缓冲区范畴的地位。 - 第 6 页,
SYS
类型:第一个回滚段页。依据须要调配其余页 (或整个区段) 来存储回滚段数据。 - 第 7 页,
SYS
类型:与数据字典相干的头信息,蕴含组成数据字典的索引的根页码。这些信息可能找到任何其余索引(表),因为它们的根页码就存储在这个数据字典中。 - 第 64 – 127 页:双写缓冲区中第一块(蕴含 64 页),双写缓冲区是 InnoDB 复原机制的一个重要局部
- 第 128 – 191 页:双写缓冲区中第二块
其余页按需分配给索引、回滚段、吊销日志(undo logs)等.
每个表空间文件
InnoDB 提供了“每个表一个文件”模式,该模式将为每个 MySQL 表创立一个文件 (如上所述实际上是一个 空间)。可能叫做“每个表一个空间”更适合一些。每个表都会创立 .ibd
文件,它的构造如下:
疏忽疾速增加索引(即在运行时增加索引),在必须的 3 个初始页之后,空间中调配的下一个页面将是表中每个索引的根页,按 表创立中定义的索引程序 排列。第 3 页将是汇集索引的根 , 第 4 页将是第一个二级索引的根,以此类推。
因为 InnoDB 的大部分元数据结构都存储在 零碎空间 中,因而在“每个表一个空间”中调配的大多数页都是 INDEX
类型的并存储表数据。