关于v8:v8-Heapsnapshot-文件解析

图片起源：debugging-memory-leaks-node-js-applications
本文作者：肖思元

在 node 中能够通过 v8.getHeapSnapshot 来获取利用以后的堆快照信息，该调用会生成一份 .heapsnapshot 文件，官网并没有对该文件的内容有一个具体的解释，本文将次要对该文件内容进行解析，并演示了一个理解文件内容后能够做的乏味的事件

v8.getHeapSnapshot

首先简略回顾下 v8.getHeapSnapshot 是如何应用的：

// test.js
const { writeHeapSnapshot } = require("v8");
class HugeObj {
 constructor() {
 this.hugeData = Buffer.alloc((1 << 20) * 50, 0);
 }
}
// 留神上面的用法在理论利用中通常是 anti-pattern，
// 这里只是为了不便演示，才将对象挂到 module 上以避免被 GC 开释
module.exports.data = new HugeObj();
writeHeapSnapshot();

将下面的代码保留到 test.js 中，而后运行 node test.js，会生成文件名相似 Heap.20210228.154141.9320.0.001.heapsnapshot 的文件，该文件能够应用 Chrome Dev Tools 进行查看

对于下面的步骤咱们也能够间接查看视频演示
当咱们将 .heapsnapshot 文件导入到 Chrome Dev Tools 之后，咱们会看到相似上面的内容：

上图表格列出了以后堆中的所有对象，其中列的含意是：

Constructor，示意对象是应用该函数结构而来
Constructor 对应的实例的数量，在 Constructor 前面的 x2 中显示
Shallow size，对象本身大小（单位是 Byte），比方下面的 HugeObj，它的实例的 Shallow size 就是本身占用的内存大小，比方，对象外部为了保护属性和值的对应关系所占用的内存，并不蕴含持有对象的大小
比方 hugeData 属性援用的 Buffer 对象的大小，并不会计算在 HugeObj 实例的 Shallow size 中
Retained size，对象本身大小加上它依赖链路上的所有对象的本身大小（Shallow size）之和
Distance，示意从根节点（Roots）达到该对象通过的最短门路的长度

heapsnapshot 文件

Chrome Dev Tools 只是 .heapsnapshot 文件的一种展示模式，如果咱们心愿最大水平利用这些信息，则须要进一步理解其文件格式
咱们能够应用任意的文本编辑器关上该文件，能够发现文件内容其实是 JSON 格局的：

因为目前没有具体的阐明文档，前面的内容咱们将联合源码来剖析该文件的内容

文件内容概览

在原始输入的文件内容中，能够发现 snapshot 字段局部是去除空白的，而 nodes 和 edges 字段的内容都是有换行分隔的，整体文件有十分多的行数
为了不便了解，咱们能够将节点折叠，这样能够看出该文件的整体内容：

随后咱们在源码中，以该 v8.getHeapSnapshot 的 binding 着手，定位到该文件内容是办法 HeapSnapshotGenerator::GenerateSnapshot 的运行后果
并且咱们晓得对象在内存中的拓扑模式须要应用 Graph 数据结构来示意，因而输入文件中有 nodes 和 edges 字段别离用于示意堆中的对象，以及对象间的连贯关系：

图片援用自 [Graphs
](https://guides.codepath.com/c…
不过 nodes 和 edges 中并没有间接存储对象的信息，而都是一连串数字，咱们须要进一步剖析其中的内容

nodes

nodes 中的每一个 Node 的序列化办法是：HeapSnapshotJSONSerializer::SerializeNode
从源码来看，每输入完 node 的所有属性值后，会跟着输入 n0，这也是输入后果中 nodes 数组是一行行数字的起因。不过咱们晓得 n0 在 JSON 反序列化的时候因为会因为本身合乎空白的定义而被疏忽掉，所以这样的换行能够了解是为了不便间接查看源文件
咱们来看一个例子，比方：

{
"nodes":[9,1,1,0,10,0 // 第一行
,9,2,3,0,23,0 // 第二行
}

下面的内容，每行别离示意一个 node，每一行都是对象的属性的 value（咱们先不必思考为什么 value 都是数值）。而属性的 name 咱们通过源码中输入的程序能够整理出来：

0. type
1. name
2. id
3. self_size
4. edge_count
5. trace_node_id

因为 value 的输入程序和下面的 name 是对应的，所以咱们能够依据属性 name 的程序作为索引，去关联其 value 的值
不过实际上并不能省略属性名称列表的输入，因为属性的内容是可能在后续的 node 版本中变动的（次要是追随 v8 的变动），为了和对应的数据生产端解耦，文件中会将属性 name 列出输入，保留在 snapshot.meta.node_fields 中

Field Type

接下来咱们来看为什么 nodes 数组保留的属性 value 都是数值
还是下面的例子，因为咱们曾经晓得了，属性名称和属性值是按索引程序对应上的，那么对于下面第一个 node 的 propertyName(propertyValue) 列表能够示意为：

0. type(9)
1. name(1)
2. id(1)
3. self_size(0)
4. edge_count(10)
5. trace_node_id(0)

比方第 1 号属性 name，它就是对象的名称，不过依据对象的类型不同，该值也会有不同的取值形式。比方对于个别对象而言，它的内容就是其构造函数的名称，对于 Regexp 对象而言，它的值就是 pattern 字符串，更多得能够参考 V8HeapExplorer::AddEntry
如果咱们间接保留属性的值，那么如果堆中有 1000 个由 HugeObj 结构的对象，HugeObj 字符串就要保留 1000 个拷贝
因为 heapdump 顾名思义，输入大小简直就和以后 Node 利用所占内存大小统一（并不完全一致，这里 heapdump 只蕴含受 GC 治理的内容），为了让输入的后果尽可能的紧凑，v8 在输入属性值的时候，按肯定的规定进行了压缩，压缩的秘诀是：

减少一条记录 snapshot.meta.node_types，来寄存属性的类型，和 snapshot.meta.node_fields 相似，它们和属性值之间也是通过索引（程序）关联的
nodes 中只寄存属性值，咱们须要计算一下偏移量（上面会讲到），来确定属性的类型：
- 如果是数值类型，那么该值就是自身的内容
- 如果是数组，则 value 对应数组中的索引
- 如果是字符串，则 value 对应 strings 数组的内容

咱们能够用上面的图来示意三者之间的关系：

咱们通过一个例子来串联下面的内容。比方咱们要看索引为 1000 的对象（留神区别 id 属性）的 name 属性的值，应用上面的形式：

取 name 属性在 snapshot.meta.node_fields 中的索引为 1
取 snapshot.meta.node_fields 数组的长度为 6
则索引为 1000 的对象的起始索引为：1000 * 6（因为对象属性的数量是固定的）
加上 name 属性的偏移量 1，则 name 在 nodes 数组中的索引为 6001 = 1000 * 6 + 1
取 name 属性在 snapshot.meta.node_types 中的类型，即 snapshot.meta.node_types[1]，在这个例子中是 string
则 strings[6001] 的内容就是 name 属性值的最终内容

其余一些字段的含意是：

id，对象的 id，v8 会确保该对象在本次利用生命周期中的屡次的 dump 下中放弃雷同的 id
self_size，也就是上文提到的 shallow size
edge_count，就是从该对象进来的边的条数，也就是子对象的数量
trace_node_id，能够临时不去思考，只有在同时应用 node --track-heap-objects 启动利用的状况下，该内容才不会为 0。它能够联合 trace_tree 和 trace_function_infos 一起晓得对象是在什么调用栈下被创立的，换句话说就是晓得通过一系列什么调用创了该对象。文本不会探讨这部分内容，或者会在当前的章节中开展

edges

edges 中的 Edge 的序列化形式是：HeapSnapshotJSONSerializer::SerializeEdge
字段内容别离是：

0. type
1. edge_name_or_index(idx or stringId)
2. to

和下面的 nodes 数组相似，edges 数组也是都存的属性的值，因而在取最终值的时候，须要联合 snapshot.meta.edge_fields snapshot.meta.edge_types 来操作
惟一的问题在于，咱们晓得 Edge 示意的对象之间的关系，而且这里是有向图，那么肯定有 From 和 To 两个字段，而下面的字段内容只有 To，那么 nodes 和 edges 是如何对应的呢？

Node 和 Edge 的对应关系

从头以 HeapSnapshotGenerator::GenerateSnapshot 办法开始剖析，看看 nodes 和 edges 是如何产生的，上面是该办法中的相干次要内容：

bool HeapSnapshotGenerator::GenerateSnapshot() {
 // ...
 // 退出 Root 节点，作为流动对象的终点
 snapshot_->AddSyntheticRootEntries();
 // 即 HeapSnapshotGenerator::FillReferences 办法，nodes 和 edges
 // 都是由该办法构建的，这里的 nodes 和 edges 指的是 HeapSnapshot 的
 // 数据成员 `entries_` 和 `edges_`
 if (!FillReferences()) return false;
 // 输入文件中的 edges 理论是通过 `FillChildren` 从新组织程序的，
 // 从新组织后的内容保留在 HeapSnapshot 的数据成员 children_ 中
 snapshot_->FillChildren();
 snapshot_->RememberLastJSObjectId();
 progress_counter_ = progress_total_;
 if (!ProgressReport(true)) return false;
 // ...
}

能够临时不去深刻理解 Node 和 Edge 是如何生成的，看一下 HeapSnapshot::FillChildren 办法是如何从新组织输入的 edges 内容的：

void HeapSnapshot::FillChildren() {
 // ...
 int children_index = 0;
 for (HeapEntry& entry : entries()) {
 children_index = entry.set_children_index(children_index);
 }
 // ...
 children().resize(edges().size());
 for (HeapGraphEdge& edge : edges()) {
 edge.from()->add_child(&edge);
 }
}

其中 entry.set_children_index 和 edge.from()->add_child 办法内容别离是：

int HeapEntry::set_children_index(int index) {
 // Note: children_count_ and children_end_index_ are parts of a union.
 int next_index = index + children_count_;
 children_end_index_ = index;
 return next_index;
}
void HeapEntry::add_child(HeapGraphEdge* edge) {
 snapshot_->children()[children_end_index_++] = edge;
}

所以对于每个 entry（即 node）都有一个属性 children_index，它示意 entry 的 children 在 children_ 数组中的起始索引（下面正文中曾经提到，heapsnapshot 文件中的 edges 数组的内容就是依据 children_ 数组输入的）
综合来看，edges 数组的内容和 nodes 之间的对应关系大抵是：

比方下面 edge0 的 From 就是 nodes[0 + 2]，其中：

nodes 示意 nodes 数组
0 的地位示意该 node 在 nodes 数组中的索引，这里也就是第一个元素
2 示意 id 属性在 snapshot.meta.node_fields 数组中的偏移量

node0 的 edge_count 能够示意成 nodes[0 + 4]：

其中 4 示意 edge_count 属性在 snapshot.meta.node_fields 数组中的偏移量
其余局部同上

所以 edges 数组中，从 0 开始的 node0.edge_count 个 edge 的 From 都是 node0.id
因为 node[n].edge_count 是变量，所以咱们无奈疾速依据索引定位到某个 edge 的 From，咱们必须从索引 0 开始，而后步进 node[n].edge_count 次（n 从 0 开始），步进次数内的 edge 的 From 都为 node[n].id，步进完结后对 n = n + 1 ，进而在下一次迭代中关联下一个 node 的 edges

heapquery

咱们结尾说理解文件内容能够做一些乏味的事件，接下来咱们将演示一个小程序 heapquery（Rust 劝入版），它能够将 .heapsnapshot 文件的内容导入到 sqlite 中，而后咱们就能够通过 SQL 来查问本人感兴趣的内容了（尽管远没有 osquery 高级，然而间接通过 SQL 来查问堆上的内容，想想都会很乏味吧）
除此以外，它还能够：

验证上文对 heapsnapshot 文件格式的剖析
对上文的文字描述提供一个可运行的代码的补充解释

因为 heapquery 的程序内容非常简单（仅仅是解析格局并导入而已），所以就不赘述了。只简略看一下波及的表构造，因为仅仅是演示用，到最初其实只有两张表：
Node 表

CREATE TABLE IF NOT EXISTS node (
 id INTEGER PRIMARY KEY,   /* 对象 id  */
 name VARCHAR(50),         /* 对象所属类型名称 */
 type VARCHAR(50),         /* 对象所属类型枚举，取自 `snapshot.meta.node_types` */
 self_size INTEGER,        /* 对象本身大小 */
 edge_count INTEGER,       /* 对象持有的子对象数量 */
 trace_node_id INTEGER
);

Edge 表

CREATE TABLE IF NOT EXISTS edge (
 from_node INTEGER,              /* 父对象 id */
 to_node INTEGER,                /* 子对象 id */
 type VARCHAR(50),               /* 关系类型，取自 `snapshot.meta.edge_types` */
 name_or_index VARCHAR(50)       /* 关系名称，属性名称或者索引 */
);

小演练

在本文结尾的地位，咱们定义了一个 HugeObj 类，在实例化该类的时候，会创立一个大小为 50M 的 Buffer 对象，并关联到其属性 hugeData 上
接下来咱们将进行一个小演练，假如咱们当时并不知道 HugeObj，咱们如何通过可能的内存异常现象反推定位到它
首先咱们须要将 .heapsnapshot 导入到 sqlite 中：

npx heapquery path_to_your_heapdump.heapsnapshot

命令运行实现后，会在当前目录下生成 path_to_your_heapdump.db 文件，咱们能够抉择本人喜爱的 sqlite browser 关上它，比方这里应用的 DB Browser for SQLite
而后咱们执行一条 SQL 语句，将 node 按 self_size 倒序排列后输入：

SELECT * FROM node ORDER By self_size DESC

咱们会失去相似上面的后果：

咱们接着从大小可疑的对象动手，当然这里就是先看截图中 id 为 51389 的这条数据了
接下来咱们再执行一条 SQL 语句，看看是哪个对象持有了对象 51389

SELECT  from_node, B.name AS from_node_name 
 FROM edge AS A 
 JOIN  node AS B ON A.from_node = B.id 
 WHERE A.to_node = 51389

咱们会失去相似上面的输入：

下面的输入中，咱们晓得持有 51389 的对象是 51387，并且该对象的类型是 ArrayBuffer
因为 ArrayBuffer 是环境内置的类，咱们并不能看出什么问题，因而须要利用下面的 SQL，持续查看 51387 是被哪个对象持有的：

和下面的输入相似，这次的 Buffer 仍然是内置对象，所以咱们持续反复下面的步骤：

这次咱们失去了一个业务对象 HugeObj，咱们看看它是在哪里定义的。对象的定义就是它的构造函数，因而咱们须要找到它的 constructor，为此咱们先列出对象的所有属性：

SELECT * FROM edge WHERE from_node = 46141 AND `type` = "property"

接着咱们在原型中持续查找：

SELECT * FROM edge WHERE from_node = 4575 AND `type` = "property"

咱们找到了 constructor 对象 4577，接着咱们来找到它的 shared 外部属性：

SELECT * FROM edge WHERE from_node = 4577 AND name_or_index = "shared"

咱们简略解释一下 shared 属性的作用是什么。首先，通常函数蕴含的信息有：

定义所在的源文件地位
原始代码（在具备 JIT 的运行时中用于 Deoptimize）
一组在业务上可复用的指令（Opcode or JITed）
PC 寄存器信息，示意当然执行到外部哪一个指令，并在将来复原时能够继续执行
BP 寄存器信息，示意以后调用栈帧在栈上的起始地址
函数对象创立时对应的闭包援用

其中「定义所在的源文件地位」、「原始代码」、「一组在业务上可复用的指令（Opcode or JITed）」是没有必要制作出多份拷贝的，因而相似这样的内容，在 v8 中就会放到 shared 对象中
接下来咱们能够输入 shared 对象 43271 的属性：

SELECT * FROM edge WHERE from_node = 43271

咱们持续输入 script_or_debug_info 属性持有的对象 8463：

SELECT * FROM edge WHERE from_node = 8463

最初咱们输入 name 属性持有的对象 4587：

这样咱们就找到了对象定义的文件，而后就能够在该文件中持续确定业务代码是否存在透露的可能
或者有人会对下面的步骤感到繁琐，其实不用放心，咱们能够联合本人理论的查问需要，将罕用的查问性能编写成子程序，这样当前只有给一个输出，就能帮忙咱们剖析出想要的后果了

小结

本文以剖析 .heapsnapshot 文件的格局为切入点，联合 node 的源码，解释了 .heapsnapshot 文件格式和其生成的形式，并提供了个 heapquery 的小程序，演示了理解其构造能够帮忙咱们取得不局限于现有工具的信息。最初祝大家上分欢快！

本文公布自网易云音乐大前端团队，文章未经受权禁止任何模式的转载。咱们长年招收前端、iOS、Android，如果你筹备换工作，又恰好喜爱云音乐，那就退出咱们 grp.music-fe(at)corp.netease.com！

关于v8:v8-Heapsnapshot-文件解析

v8.getHeapSnapshot

heapsnapshot 文件

文件内容概览

nodes

Field Type

edges

Node 和 Edge 的对应关系

heapquery

小演练

小结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于v8:v8-Heapsnapshot-文件解析

v8.getHeapSnapshot

heapsnapshot 文件

文件内容概览

nodes

Field Type

edges

Node 和 Edge 的对应关系

heapquery

小演练

小结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复