Vue源码解析：AST语法树转render函数

jiezi

6 年前

通过对 Vue2.0 源码阅读，想写一写自己的理解，能力有限故从尤大佬 2016.4.11 第一次提交开始读，准备陆续写：

模版字符串转 AST 语法树
AST 语法树转 render 函数
Vue 双向绑定原理
Vue 虚拟 dom 比较原理

其中包含自己的理解和源码的分析，尽量通俗易懂！由于是 2.0 的最早提交，所以和最新版本有很多差异、bug，后续将陆续补充，敬请谅解！包含中文注释的 Vue 源码已上传 …

开始
今天要说的代码全在 codegen 文件夹中，在说实现原理前，还是先看个简单的例子！
<div class=”container”>
<span>{{msg}}</span>
<button :class=”{active: isActive}” @click=”handle”>change msg</button>
</div>
上述类名为 container 的元素节点包含 5 个子节点（其中 3 个是换行文本节点），转化成的 AST 语法树：
AST 语法树转的 render 函数长这样：
function _render() {
with (this) {
return __h__(
‘div’,
{staticClass: “container”},
[
” “,
__h__(‘span’, {}, [String((msg))]),
” “,
__h__(‘button’, {class: {active: isActive},on:{“click”:handle}}, [“change msg”]),
” ”
]
)
};
}
可以的看出，render 函数做的事情很简单，就是把语法树每个节点的指令进行解析。
看下 render 函数，它是由 with 函数包裹（为了改变作用域），要用的时候直接_render.call(vm)；另外就是__h__函数，这个后面会说到，这个函数用于元素节点的解析，接收 3 个参数：元素节点标签名，节点数据，子节点数据。这个函数最后返回的就是虚拟 dom 了，不过今天先不深究，先说如何生成这样的 render 函数，主要是 v -if、v-for、v-bind、v-on 等指令的解析。
源码解析
这边解析的是从 AST 树转换成 render 函数部分的源码，由于 vue2.0 第一次提交的源码这部分不全，故做了部分更新，代码全在 codegen 文件夹中。
入口
整个 AST 语法树转 render 函数的起点是 index.js 文件中的 generate()函数：
export function generate (ast) {
const code = genElement(ast);
return new Function (`with (this) {return ${code}}`);
}
明显看到，generate()函数传入参数为 AST 语法树，内部调用 genElement()函数开始解析根节点（容器节点）。genElement()函数用于解析元素节点，它接收两个参数：AST 对象和节点标识（v-for 的 key），最后返回形如__h__(‘div’, {}, [])的字符串，看一下内部逻辑：
function genElement (el, key) {
let exp;
if (exp = getAndRemoveAttr(el, ‘v-for’)) {// 解析 v -for 指令
return genFor(el, exp);
} else if (exp = getAndRemoveAttr(el, ‘v-if’)) {// 解析 v -if 指令
return genIf(el, exp, key);
} else if (el.tag === ‘template’) {// 解析子组件
return genChildren(el);
} else {
return `__h__(‘${el.tag}’, ${genData(el, key) }, ${genChildren(el)})`;
}
}
genElement()函数内部依次调用 getAndRemoveAttr()函数判断了 v -for、v-if 标签是否存在，若存在则删除并返回表达式；随后判断节点名为 template 就直接进入子节点解析；以上条件都不符合就返回__h__函数字符串，该字符串将使用到属性解析和子节点解析。
function getAndRemoveAttr (el, attr) {
let val;
// 如果属性存在，则从 AST 对象的 attrs 和 attrsMap 移除
if (val = el.attrsMap[attr]) {
el.attrsMap[attr] = null;
for (let i = 0, l = el.attrs.length; i < l; i++) {
if (el.attrs[i].name === attr) {
el.attrs.splice(i, 1);
break;
}
}
}
return val;
}
v-for 和 v-if 指令解析
让我们先看看 v -for 的编译：
function genFor (el, exp) {
const inMatch = exp.match(/([a-zA-Z_][\w]*)\s+(?:in|of)\s+(.*)/);
if (!inMatch) {
throw new Error(‘Invalid v-for expression: ‘+ exp);
}
const alias = inMatch[1].trim();
exp = inMatch[2].trim();
let key = getAndRemoveAttr(el, ‘track-by’); // 后面用 :key 代替了 track-by

if (!key) {
key =’undefined’;
} else if (key !== ‘$index’) {
key = alias + ‘[“‘ + key + ‘”]’;
}

return `(${exp}) && (${exp}).map(function (${alias}, $index) {return ${genElement(el, key)}})`;
}
该函数先进行正则匹配，如 ”item in items”，将解析出别名（item）和表达式（items），再去看看当前节点是否含:key，如果有那就作为 genElement()函数的参数解析子节点。举个????，对于模版 <div v-for=”item in items” track-by=”id”></div>，将解析成：
`(items) && (items).map(function (item, $index) {return ${genElement(el, item[“id”])}})`
你会发现 v -for 解析完，通过 mao 循环对该节点继续解析，但此时该节点已经没有的 v -for 和:key 属性了。继续看看 v -if 的解析：
function genIf (el, exp, key) {
return `(${exp}) ? ${genElement(el, key)} : null`;
}
v-if 的解析就很粗暴，直接通过条件运算符去决定继续解析该节点，还是直接返回 null。
属性解析
这里说的属性解析，包括了 v -bind 指令、v-on 指令和 v -model 指令的解析，以及普通属性的解析。这些解析都在 genData()函数中：
function genData (el, key) {
if (!el.attrs.length && !key) {
return ‘{}’;
}
let data = ‘{‘;
let attrs = `attrs:{`;
let props = `props:{`;
let events = {};
let hasAttrs = false;
let hasProps = false;
let hasEvents = false;

…

if (hasAttrs) {
data += attrs.slice(0, -1) + ‘},’;
}
if (hasProps) {
data += props.slice(0, -1) + ‘},’;
}
if (hasEvents) {
data += genEvents(events); // 事件解析
}
return data.replace(/,$/, ”) + ‘}’;
}
看一下 genData()函数整体，先是判断有没有属性，然后定义了多个变量：data 是输出结果；attrs 用于存储节点属性；props 用于存储节点某些特殊属性；event 用于存储事件；hasxxx 是当前节点是否含 xxx 的标识。随后会进行属性的遍历计算，最后通过对 hasxxx 的判断来对 data 进行拼接输出。重点是中间属性的遍历、各种指令 / 属性的处理，先看看特殊的 key 和 class：
if (key) {
data += `key:${key},`;
}

if (/^v-|^@|^:/.test(name)) {
const modifiers = parseModifiers(name); // 事件修饰符（.stop/.prevent/.self）
name = removeModifiers(name);

if (/^:|^v-bind:/.test(name)) {// v-bind
name = name.replace(/^:|^v-bind:/, ”);
if (name === ‘style’) {
data += `style: ${value},`;
} else if (/^(value|selected|checked|muted)$/.test(name)) {
hasProps = true;
props += `”${name}”: (${value}),`;
} else {
hasAttrs = true;
attrs += `”${name}”: (${value}),`;
}
} else if (/^@|^v-on:/.test(name)) {// v-on
hasEvents = true;
name = name.replace(/^@|^v-on:/, ”);
addHandler(events, name, value, modifiers);
} else if (name === ‘v-model’) {// v-model
hasProps = hasEvents = true;
props += genModel(el, events, value) + ‘,’;
}
} else {
hasAttrs = true;
attrs += `”${name}”: (${JSON.stringify(attr.value)}),`;
}
}
通过 for 循环对节点属性进行遍历，先用 /^v-|^@|^:/ 正则判断当前属性是否为指令，若不是就直接添加到 attrs 中，若是就需要继续进行解析了。进入 if 后首先来到了事件修饰符的处理，主要用到了 parseModifiers()、removeModifiers()两个函数，主要就是拿到事件修饰符并删除，如 v -on:click.prevent.self，将返回[‘prevent’, ‘self’]，简单看一下：
function parseModifiers (name) {
const match = name.match(/\.[^\.]+/g);
if (match) {
return match.map(m => m.slice(1));
}
}

{
data: {
val: ”
},
methods: {
fn (e) {
this.val = e.target.value;
}
}
}
所以对双向绑定的处理，就是对不同的元素节点采用不同的事件绑定而已，如对于 select 标签用 onchange 监听，对文本输入框用 oninput 监听 … 这部分的代码全在 model.js 文件中，看一下 genModel()函数吧：
function genModel (el, events, value) {
if (el.tag === ‘select’) {
if (el.attrsMap.multiple != null) {// 同时选择多个选项
return genMultiSelect(events, value, el)
} else {
return genSelect(events, value)
}
} else {
switch (el.attrsMap.type) {
case ‘checkbox’:
return genCheckboxModel(events, value)
case ‘radio’:
return genRadioModel(events, value, el)
default:
return genDefaultModel(events, value)
}
}
}
依次找了 select 标签和 input 标签，这边还考虑到了下拉标签的多选情况，然后找对应函数去解析，这边就拿文本框的处理函数 genDefaultModel()来举例：
function genDefaultModel (events, value) {
addHandler(events, ‘input’, `${value}=$event.target.value`);
return `value:(${value})`;
}
该函数先调用之前提到的 addHandler()函数添加时间，再返回 value 属性追加到 props 中。其他下拉框、单选框等的处理函数也是类似 …
最后还有对事件的处理，我们前面只是把事件都存储到 events 对象中，需要处理后添加到 data 返回值中，主要用到的函数是 genEvents()：
const simplePathRE = /^[A-Za-z_$][\w$]*(?:\.[A-Za-z_$][\w$]*|\[‘.*?’\]|\[“.*?”\]|\[\d+\]|\[[A-Za-z_$][\w$]*\])*$/
const modifierCode = {
stop: ‘$event.stopPropagation();’,
prevent: ‘$event.preventDefault();’,
self: ‘if($event.target !== $event.currentTarget)return;’
}

function genEvents (events) {
let res = ‘on:{‘;
for (let name in events) {
res += `”${name}”:${genHandler(events[name])},`;
}
return res.slice(0, -1) + ‘}’;
}

function genHandler (handler) {
if (!handler) {
return `function(){}`;
} else if (isArray(handler)) {
// handler 为数组则循环调用
return `[${handler.map(genHandler).join(‘,’)}]`;
} else if (!handler.modifiers || !handler.modifiers.length) {

return simplePathRE.test(handler.value)
? handler.value
: `function($event){${handler.value}}`;
} else {
let code = ‘function($event){‘;
for (let i = 0; i < handler.modifiers.length; i++) {
let modifier = handler.modifiers[i];
code += modifierCode[modifier];
}
let handlerCode = simplePathRE.test(handler.value)
? handler.value + ‘()’
: handler.value;
return code + handlerCode + ‘}’;
}
}
simplePathRE 正则用于看属性值是否是简单函数名，fn 是简单函数名而 fn(‘x’)不是；modifierCode 对象用于存储事件修饰符对应的 js 代码；genEvents()函数对 events 对象进行遍历，调用 genHandler()函数逐个解析；genHandler()函数内部是对不同的参数进行不同的处理，做的比较好的是：

对是否是简单函数的处理，例如 @click=”fn” 会返回 click: fn，@click=”fn(’11’)” 会返回 click: function($event){fn(’11’)}，这将大大便利了后续 dom 事件的绑定；
对是否含事件修饰符的处理，例如 @click.stop=”fn”，将返回 click: function($event){$event.stopPropagation();fn()}。

到这里，所有属性都解析完毕了！返回的结果形如{key: …,class: …,staticClass: …,attrs: {…},props: {…},on: {…}}。
子节点解析
子节点的解析主要是用到了 genChildren()函数：
function genChildren (el) {
if (!el.children.length) {
return ‘undefined’;
}
return ‘[‘ + el.children.map(node => {
if (node.tag) {
return genElement(node);
} else {
return genText(node);
}
}).join(‘,’) + ‘]’;
}
通过 map 方法对子节点数组进行循环，依次判断节点标签是否存在，再分别解析元素节点和文本节点，最后将结果拼接成数组形式的字符串。元素节点的解析函数 genElement()上面说过了，接下来说说文本节点的解析函数 genText()：
function genText (text) {
if (text === ‘ ‘) {
return ‘” “‘;
} else {
const exp = parseText(text);
if (exp) {
return ‘String(‘ + exp + ‘)’;
} else {
return JSON.stringify(text);
}
}
}
判断一波是否有文本，有就继续调用 parseText()函数：
const tagRE = /\{\{((?:.|\\n)+?)\}\}/g;
export function parseText (text) {
if (!tagRE.test(text)) {
return null;
}
var tokens = [];
var lastIndex = tagRE.lastIndex = 0;
var match, index, value;
while (match = tagRE.exec(text)) {// 循环解析 {{}}
index = match.index;
// 把 ‘{{‘ 之前的文本推入
if (index > lastIndex) {
tokens.push(JSON.stringify(text.slice(lastIndex, index)));
}
// 把 {{}} 中间数据取出推入
value = match[1];
tokens.push(‘(‘ + match[1].trim() + ‘)’);
lastIndex = index + match[0].length;
}
if (lastIndex < text.length) {
tokens.push(JSON.stringify(text.slice(lastIndex)));
}
return tokens.join(‘+’);
}
该函数通过循环调用 tagRE 正则匹配文本，依次匹配出 {{}}，并推入数组，最后将数组转为字符串。例如文本 hi,{{name}}!，将返回 ’hi’+(name)+’!’。
总结
到这也终于算是说完了，虽然这部分做的事情比较简单，主要就是指令解析，将 AST 树解析为 render 函数，但代码量感觉挺大的，这边还有很多地方等待完善，等后续继续补充 …
好困啊，晚安了