原文地址：blog.jcole.us/2013/01/03/…

在数据存储模型中，通常有“空间”这个概念，在 MySQL 中被称为“表空间”，有时候在 InnoDB 中也被称为“文件空间”。一个空间可能由一个操作系统中的多个理论文件组成（例如 ibdata1, ibdata2 等等），实际上只是一个逻辑文件 – 多个文理文件被当做一个连贯在一起的文件解决。

InnoDB 中每个空间都被调配了一个 32 位的无符号整型空间 ID，这个 ID 被用来在不同的中央援用指向这个空间。InnoDB 总是有一个“零碎空间”，他的空间 ID 是 0。零碎空间用于保留 InnoDB 的一系列元数据的记录。通过 MySQL，InnoDB 目前只反对“一个表一个文件”空间模式的额定空间，这将为每一个 MySQL 表创立 .ibd 文件。从外部来看，这个 .ibd 文件理论是一个能够包容多个表的残缺的空间，然而在 MySQL 的实现中，它只能蕴含一个表。

页
=

每个空间被切分成了页，个别每页 16 KiB（也能够通过在编译时指定 UNIV_PAGE_SIZE 批改，或者开启了 InnoDB 压缩）。空间中的页会被调配一个 32 位的页码，这个页码被称为偏移，其实这个页码就是从空间地址结尾的页偏移。所以，第 0 页位于文件偏移 0 的地位，第 1 页位于文件偏移 16384 的地位，以此类推。可能这里有些人会想起来，InnoDB 的数据大小限度是 64 TiB，这个其实是每个空间的大小限度。因为页码是一个 32 位的无符号整型，并且默认的页大小是 16 KiB，这样空间最大大小是 2^32 * 16 KiB = 64 TiB

页的构造如下：

每一页都有一个 38 字节的 FIL 头部和一个 FIL 尾部（FIL这个名字其实就是出自 “file”的简写）。头部蕴含一个示意页类型的字段，这个类型决定了页的剩下局部的构造。 FIL 头部和 FIL 尾部构造如下所示：

FIL 头部以及尾部蕴含以下构造：

页类型（2 bytes）：这对于解析剩下的页数据是很重要的。很多模块以及场景下须要调配页存储，包含文件空间治理，范畴治理，事务零碎，数据字段，undo log，blobs 数据 还有索引以及表数据。
空间 ID（4 bytes）
页码（4 bytes）：当页被初始化的时候页码就被存入了。查看该字段保留的页码与依据文件偏移量读取到的页码是否匹配，有助于表明读取是否是正确的。并且，如果这个字段被初始化了，表明这个页也被初始化了
checksum（4 bytes）和老版 checksum（4 bytes）
上一页（4 bytes）与下一页（4 bytes）的指针：这样能够构建双向链表，并用于索引页来讲所有页在同一级别链接起来，从而进步索引全扫描的效率。然而有很多页面类型不应用这些字段。
头部保留最近批改对应的 LSN（日志序列号，8 bytes），同时这个序列号的低 32 位也保留在尾部。
全局最大的日志序列号（被称为 flush LSN，8 bytes），真正的序列号只保留在第 0 个空间的第 0 页，其余页这个字段的值都是 0，相当于都复用第 0 个空间的第 0 页的这个字段。这样全局产生批改的时候只用批改一个字段就行了。

空间文件

一个空间文件是很多页（最多 2^32）的聚合链接，为了更高效的治理，页被聚合成很多个 1 MiB 大小的块（64 个间断页，默认页大小是 16 KiB），这个块被称为“区”（extent）。很多构造只通过援用区来在一个空间中调配页

InnoDB 须要做一些元数据记录，来追踪所有页，区以及空间自身。

空间中的第一页是 FSP_HDR(文件空间头页)。FSP_HDR 页蕴含一个 FSP 构造，记录像是空间的大小，闲暇区、碎片区和满区的列表等数据（未来我会写一篇具体的对于闲暇空间治理介绍的文章）。一页 FSP_HDR 只有够保留 256 个区（相当于 16384 页，256 MiB）信息的空间，所以每 16384 页之后，都须要额定记录这些页信息的空间。XDES 页和 FSP_HDR 页的构造是雷同的，只是在 XDES 中 FSP 占用的存储都是被 0 填充的。这些额定的页会随着空间文件的增长而主动调配。

INODE 页用来保留文件段（Segmentation，蕴含一组区以及一个只会独自调配的碎片区的数组）的列表。每个 INDOE 页能够保留 85 个 INODE 元素，每个索引须要两个 INODE 元素（未来我会写一篇具体的对于 INDOE 元素内容和文件区的文章）。

IBUF_BITMAP 页保留对于插入缓存的信息，不在本系列的探讨范畴内。

零碎空间

零碎空间(第 0 个空间)比拟非凡，蕴含许多按固定页码调配的页面，以存储对 InnoDB 操作至关重要的大量信息。零碎空间与任何其余空间一样，也须要 FSP_HDR, IBUF_BITMAP，Inode 这三个页面作为头三页。这之后，与其余页面有点区别。

第 3 页，SYS 类型：与插入缓存相干的头信息。
第 4 页，INDEX 类型：用于插入缓冲的索引构造的根页。
第 5 页，TRX_SYS 类型：与 InnoDB 事务零碎的操作相干的信息，例如最新的事务ID、MySQL二进制日志信息和双写缓冲区范畴的地位。
第 6 页，SYS 类型：第一个回滚段页。依据须要调配其余页(或整个区段)来存储回滚段数据。
第 7 页，SYS 类型：与数据字典相干的头信息，蕴含组成数据字典的索引的根页码。这些信息可能找到任何其余索引(表)，因为它们的根页码就存储在这个数据字典中。
第 64 – 127 页：双写缓冲区中第一块（蕴含 64 页），双写缓冲区是 InnoDB 复原机制的一个重要局部
第 128 – 191 页：双写缓冲区中第二块

其余页按需分配给索引、回滚段、吊销日志（undo logs）等.

每个表空间文件

InnoDB提供了“每个表一个文件”模式，该模式将为每个 MySQL 表创立一个文件(如上所述实际上是一个空间)。可能叫做“每个表一个空间”更适合一些。每个表都会创立 .ibd 文件，它的构造如下：

疏忽疾速增加索引（即在运行时增加索引），在必须的3个初始页之后，空间中调配的下一个页面将是表中每个索引的根页，按表创立中定义的索引程序排列。第 3 页将是汇集索引的根，第 4 页将是第一个二级索引的根，以此类推。

因为 InnoDB 的大部分元数据结构都存储在零碎空间中，因而在“每个表一个空间”中调配的大多数页都是 INDEX 类型的并存储表数据。

关于mysql:J-Cole-的-InnoDB-系列-3-InnoDB空间文件布局的基础

空间文件

零碎空间

每个表空间文件

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于mysql:J-Cole-的-InnoDB-系列-3-InnoDB空间文件布局的基础

空间文件

零碎空间

每个表空间文件

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复