关于lua:构建Lua解释器虚拟机的基础

前言

在本篇，咱们正式进入到Lua解释器的开发阶段（这是一个遵循Lua 5.3规范的我的项目）。本篇并不间接接入到设计和实现语法分析器和词法分析器的阶段，而是先设计和实现Lua虚拟机的根底数据结构（包含Lua最根本的数据结构，如根本数据类型、示意虚拟机状态的global_State和lua_State构造、在函数调用中表演重要角色的CallInfo构造等）以及设计和实现基于栈的C函数调用流程。这些都是了解前面虚拟机运作的根底。因为这是一个仿造我的项目，为了和官网版本做辨别，就称之为dummylua，前面要称说本我的项目时，一律用dummylua来示意。

本篇将分为几个局部：首先介绍工程目录构造的组织，以及为什么要这样组织，每个目录别离蕴含哪些文件，这些文件别离蕴含哪些内容；其次是着手进行Lua根本类型的设计与实现，实现示意Lua虚拟机状态的global_State和lua_State构造，以及用于函数调用的CallInfo构造；接着是设计咱们在应用层，要实现C函数，在栈中调用流程的API，并且构建从虚拟机状态初始化到函数实现调用的逻辑图，论述这个过程；最初通过编写代码，将所有的流程实现。第一局部的性能曾经实现开发和测试（Ubuntu、Mac和Windows平台）。

获取源码能够查看：
https://github.com/Manistein/…

目录构造

在开始介绍我的项目的目录构造之前，咱们无妨先回顾一下Lua运作的两种基本模式。

一种是创立Lua虚拟机，间接加载脚本并且间接运行，其遵循如下流程：

创立Lua虚拟机状态实例
加载规范库
加载脚本，通过词法分析器Lexer和语法分析器Parser将脚本编译成Lua虚拟机可能辨认的Opcodes，并存储在虚拟机状态实例中
运行虚拟机，对虚拟机状态实例中的Opcodes进行执行

还有一种则是，事后将脚本编译，而后将内存中的指令信息，Dump到文件中，以Bytecode的模式存在，当前要运行的时候，间接加载Dump文件的Bytecode并且间接运行：

创立Lua虚拟机状态实例
加载规范库
加载脚本，通过词法分析器Lexer和语法分析器Parser将脚本编译成Lua虚拟机可能辨认的Opcodes，并存储在虚拟机状态实例中
将虚拟机指令Dump成二进制文件，以Bytecode的模式保留
在未来某个时刻，运行Lua虚拟机，并加载Dump后的文件，间接通过Dump数据，将指令构造还原回来，保留在虚拟机状态实例中
运行虚拟机，对虚拟机状态实例中的Opcodes进行执行

这两种形式，前者从虚拟机创立到加载脚本，再到运行零打碎敲。后者须要事后将Lua脚本编译成Bytecode，而后要应用的时候再加载运行，运行时省去了编译流程，比前者更快。不过当初Lua间接加载脚本并运行曾经足够快了，除非对性能有极其刻薄的要求，否则前者曾经可能满足咱们的日常须要了。上面援用一张《The Lua Architecture》（Reference 1）中的一张图，来展现一下前面一种形式的流程。

从上图，咱们能够理解到一个流程，就是咱们要运行Lua脚本，首先要创立Lua解释器（因为Lua是采纳纯C来写的工程，因而函数和数据是拆散的，这里其实也只是创立一个Lua虚拟机状态实例，也就是前面咱们要介绍的lua_State构造和global_State构造），而后通过编译器（Lexer和Parser）将脚本编译成虚拟机可能辨认的指令（Opcodes），再交给虚拟机执行。因而，咱们能够将编译和运行宰割开来，他们独特应用的局部也独自抽离进去，于是咱们的目录构造能够按如下所示的形式组织：

+ 3rd/              #援用的第三方库均搁置在这里
+ bin/              #编译生成的二进制文件搁置在这里
+ clib/             #内部要在c层应用Lua的C API，那么只能调用clib里提供的接口，而不能调用其余外部接口
+ common/           #vm和compiler独特应用的构造、接口均搁置在这里
+ compiler/         #编译器相干的局部搁置在这里
+ test/             #测试用例全副搁置在这里
+ vm/               #虚拟机相干的局部搁置在这里
  main.c
  makefile

咱们有理由置信，目录组织也是架构的一部分，下面附上了目录阐明，可能清晰阐明他们的分类和作用。我想构建的逻辑档次图如下所示：

3rd和common作为vm和compiler的根底模块而存在，内部在应用c接口的时候，只能通过clib里的辅助库来进行，以暗藏不必要裸露的细节。在定下目录构造当前，接下来将展现不同的文件别离有哪些文件。

目录组织实现当前，接下来确定有哪些文件了，我将文件内容展现到上面局部：

+ 3rd/              #援用的第三方库均搁置在这里
+ bin/              #编译生成的二进制文件搁置在这里
~ clib/             #内部要在c层应用Lua的C API，那么只能调用clib里提供的接口，而不能调用其余外部接口
  luaaux.h              #供内部应用的辅助库
  luaaux.c
~ common/           #vm和compiler独特应用的构造、接口均搁置在这里
  lua.h                 #提供lua根本类型的定义，错误码定义，全我的项目都可能用到的宏均会搁置在这里
  luamem.h              #lua内存分配器
  luamem.c
  luaobject.h           #lua根本类型
  luaobject.c
  luastate.h            #虚拟机状态构造，以及对其相干操作的接口均搁置于此
  luastate.c
+ compiler/         #编译器相干的局部搁置在这里
+ test/             #测试用例全副搁置在这里
~ vm/               #虚拟机相干的局部搁置在这里
  luado.h               #函数调用相干的接口均搁置于此
  luado.c
  main.c
  makefile

下面展现了咱们本局部要实现的局部，后续开发会陆续增加新的文件，前面章节也会陆续援用这个片段。到当初为止，咱们的目录构造就介绍完了，前面将介绍根本数据结构。

根本数据结构

根本类型
Lua的根本类型，包含lua_Integer、lua_Number、lu_byte、lua_CFunction等，当然最典型的则是其可能代表任何根本类型的TValue构造。当初咱们将逐个实现这些类型。

首先咱们要实现两个宏，LUA_INTEGER和LUA_NUMBER在common/lua.h里：

// common/lua.h
#ifndef lua_h
#define lua_h 

static int POINTER_SIZE = sizeof(void*);

#if POINTER_SIZE  >= 8
#define LUA_INTEGER long
#define LUA_NUMBER double
#else
#define LUA_INTEGER int 
#define LUA_NUMBER float 
#endif 

#endif

而后在common/luaobject.h中退出上面几行代码：

// common/luaobject.h
#ifndef luaobject_h
#define luaobject_h 

#include "lua.h"

typedef LUA_INTEGER lua_Integer;
typedef LUA_NUMBER lua_Number;

#endif

此时咱们的lua_Integer和lua_Number类型就定义完了，这里要先在common/lua.h中定义LUA_INTEGER的目标是让LUA_INTEGER适配32bit和64bit两种编译环境的逻辑保留在lua.h中。适配的目标也是为了前面的Value构造的各个字段可能完满对齐。官网实现版本，甚至对编译器类型做了适配，这里咱们只思考32bit和64bit的状况。

接下来咱们要定义lu_byte和lua_CFunction两种根本类型，他们的定义如下所示：

// common/luaobject.h
#ifndef luaobject_h
#define luaobject_h 

#include "lua.h"

typedef struct lua_State lua_State;

typedef LUA_INTEGER lua_Integer;
typedef LUA_NUMBER lua_Number;
typedef unsigned char lu_byte;
typedef int (*lua_CFunction)(lua_State* L);

#endif

lu_byte是个unsigned char类型，官网将其取名作lu_byte兴许是示意lua unsigned byte的意思。而lua_CFunction基本上就是Lua栈中，能被调用的light c function的模式了。

在实现了最根本类型的定义后，当初要来定义Lua的通用数据类型Value和TValue了，咱们将这两个数据结构定义在common/luaobject.h中：

// common/luaobject.h
#ifndef luaobject_h
#define luaobject_h 

#include "lua.h"

...

typedef union lua_Value {
    void* p;            // light userdata
    int b;              // boolean: 1 = true, 0 = false
    lua_Integer i;
    lua_Number n;
    lua_CFunction f;
} Value;

typedef struct lua_TValue {
    Value value_;
    int tt_;
} TValue;

#endif

Value是一个union类型，以上5种类型在32bit环境下，共用4个字节的内存，在64bit环境下共用8个字节的内存，这样做的目标是为了节约内存，p指针是用来寄存light userdata的，这种值在官网Lua中，须要咱们自行治理内存，因为目前咱们没有实现GC，因而所有的自定义类型被创立进去后，均放在p中。TValue蕴含了Value类型的值value_，以及应用一个int变量tt_示意其类型。咱们能够应用TValue来示意任何Lua对象。此外TValue的类型定义在common/lua.h中，如下所示：

// common/lua.h 

// basic object type
#define LUA_TNUMBER 1
#define LUA_TLIGHTUSERDATA 2
#define LUA_TBOOLEAN 3
#define LUA_TSTRING 4
#define LUA_TNIL 5
#define LUA_TTABLE 6
#define LUA_TFUNCTION 7
#define LUA_TTHREAD 8
#define LUA_TNONE 9

因为名称都很直观，这里就不加正文了。下面论述的还是个别类型，其中LUA_TNUMBER、LUA_TSTRING和LUA_TFUNCTION还能够细分，我将细分的类型在common/luaobject.h里定义，放在这里更加贴近应用它的接口：

// common/luaobject.h

// lua number type 
#define LUA_NUMINT (LUA_TNUMBER | (0 << 4))
#define LUA_NUMFLT (LUA_TNUMBER | (1 << 4))

// lua function type 
#define LUA_TLCL (LUA_TFUNCTION | (0 << 4))
#define LUA_TLCF (LUA_TFUNCTION | (1 << 4))
#define LUA_TCCL (LUA_TFUNCTION | (2 << 4))

// string type 
#define LUA_LNGSTR (LUA_TSTRING | (0 << 4))
#define LUA_SHRSTR (LUA_TSTRING | (1 << 4))

能够察看到，Lua数值的大类型定义的值在1~8之间，也就是00012~10002之间，那么小类型不能占用低四位，只能往高位作文章，因而他们别离的含意为：

LUA_NUMINT <=> LUA_TNUMBER | (0 << 4) <=> 00012 | 00002 <=> 00012 <=> 1
LUA_NUMFLT <=> LUA_TNUMBER | (1 << 4) <=> 00012 | 100002 <=> 100012 <=> 17
LUA_TLCL <=> LUA_TFUNCTION | (0 << 4) <=> 01112 | 00002 <=> 01112 <=> 7
LUA_TLCF <=> LUA_TFUNCTION | (1 << 4) <=> 01112 | 100002 <=> 101112 <=> 23
LUA_TCCL <=> LUA_TFUNCTION | (2 << 4) <=> 01112 | 1000002 <=> 1001112 <=> 39
LUA_LNGSTR <=> LUA_TSTRING | (0 << 4) <=> 01002 | 00002 <=> 01002 <=> 4
LUA_SHRSTR <=> LUA_TSTRING | (1 << 4) <=> 01002 | 100002 <=> 101002 <=> 20

这些类型值，将被存储在TValue的tt_变量中。到目前为止咱们曾经介绍完了Lua根本数据类型。接下来咱们将定义lua_State和global_State。

lua_State、CallInfo和global_State
在介绍完TValue数据结构当前，接下来要介绍和虚拟机非亲非故的虚拟机状态数据结构lua_State和global_State。如果说，虚拟机指令要在栈上运行，那么这个栈就是保留在lua_State这个构造体中。同时咱们的CallInfo构造，用于标记函数在栈中的地位，标记调用函数时，它的栈顶位于lua_State栈中的哪个地位，同时它还保留要返回多少个返回值的标记。而global_State则是蕴含了lua_State和一个内存分配器等，透过global_State来治理内存和lua_State是十分不便的事件，在官网的Lua版本中，咱们还须要透过它来治理GC。当初咱们来定义这些个构造体，将其定义在common/luastate.h中：

// common/luastate.h
typedef TValue* StkId;

struct CallInfo {
    StkId func;                     // 被调用函数在栈中的地位
    StkId top;                      // 被调用函数的栈顶地位
    int nresult;                    // 有多少个返回值
    int callstatus;                 // 调用状态
    struct CallInfo* next;          // 下一个调用
    struct CallInfo* previous;      // 上一个调用
};

typedef struct lua_State {
    StkId stack;                    // 栈
    StkId stack_last;               // 从这里开始，栈不能被应用
    StkId top;                      // 栈顶，调用函数时动静扭转
    int stack_size;                 // 栈的整体大小
    struct lua_longjmp* errorjmp;   // 保护模式中，要用到的构造，当异样抛出时，跳出逻辑
    int status;                     // lua_State的状态
    struct lua_State* next;         // 下一个lua_State，通常创立协程时会产生
    struct lua_State* previous;     
    struct CallInfo base_ci;        // 和lua_State生命周期统一的函数调用信息
    struct CallInfo* ci;            // 以后运作的CallInfo
    struct global_State* l_G;       // global_State指针
    ptrdiff_t errorfunc;            // 谬误函数位于栈的哪个地位
    int ncalls;                     // 进行多少次函数调用
} lua_State;

typedef struct global_State {
    struct lua_State* mainthread;   // 咱们的lua_State其实是lua thread，某种程度上来说，它也是协程
    lua_Alloc frealloc;             // 一个能够自定义的内存调配函数
    void* ud;                       // 当咱们自定义内存分配器时，可能要用到这个构造，然而咱们用官网默认的版本
                                    // 因而它始终是NULL
    lua_CFunction panic;            // 当调用LUA_THROW接口时，如果以后不处于保护模式，那么会间接调用panic函数
                                    // panic函数通常是输入一些要害日志
} global_State;

我将构造的阐明，间接写到了正文里，这些正文可能对构造进行很好的解释和阐明。当初咱们也实现了CallInfo、lua_State和global_State的定义，接下来进入下一个阶段。

函数调用流程

到目前为止，咱们曾经实现了Lua根本数据结构的定义，本篇的指标除了定义这些数据结构，对其中的字段加以阐明之外，还将设计和实现C函数在lua_State栈中的调用。在开始实现具体细节之前，咱们无妨从应用程序调用的视角来察看这个流程。咱们以如下的代码为例子：

// main.c

#include "clib/luaaux.h"

static int add_op(struct lua_State* L) {
    int left = luaL_tointeger(L, -2);
    int right = luaL_tointeger(L, -1);

    luaL_pushinteger(L, left + right);

    return 1;
}

int main(int argc, char** argv) {
    struct lua_State* L = luaL_newstate();              // 创立虚拟机状态实例
    luaL_pushcfunction(L, &add_op);                     // 将要被调用的函数add_op入栈
    luaL_pushinteger(L, 1);                             // 参数入栈
    luaL_pushinteger(L, 1);
    luaL_pcall(L, 2, 1);                                // 调用add_op函数，并将后果push到栈中

    int result = luaL_tointeger(L, -1);                 // 实现函数调用，栈顶就是add_op放入的后果
    printf("result is %d\n", result);
    luaL_pop(L);                                        // 后果出栈，保障栈的正确性

    printf("final stack size %d\n", luaL_stacksize(L));

    luaL_close(L);                                      // 销毁虚拟机状态实例

    system("pause");
    return 0;
}

正如咱们之前设计的那样，要应用dummylua的接口，只能应用clib库里的luaaux.h里定义的接口，这些接口的结尾一律以luaL*示意，L指代Lib（官网能调用的接口并非均是以luaL*结尾的，这点须要强调一下）。下面一段代码，咱们先创立了一个lua_State实例，而后Push了要调用的函数和参数，最终调用了这个函数，这个函数最终将后果入栈，并返回给调用者。在摸索代码细节之前，我先绘制几张逻辑图，来形容这个过程，以更好地让大家了解这个逻辑调用过程。

首先咱们调用了luaL_newstate接口，用于创立和初始化lua_State实例，这个接口不仅仅会创立lua_State实例，也会创立一个global_State实例，并且初始化它们，global_State对外部是不可见的，它是Lua虚拟机外部应用的一个构造，在实现函数调用当前，咱们能够失去下图的构造：

咱们能够看到，global_State实例也被一起创立了，并且将mainthread指针指向了lua_State实例，lua_State默认就有一个CallInfo类型的变量base_ci，这个CallInfo的func和top指针，指明了一个被调用的函数所能应用的栈的范畴，每当咱们调用一个新的函数时，会从lua_State的stack中，取出一段作为该函数的栈空间，开始地位是CallInfo类型变量func指针的下一个地位，而能被应用的栈空间限度个别是20个（官网版本由LUA_MINSTACK这个宏指定）。此外lua_State的stack指针，指向了栈起始的地位，而从stack_last开始，包含前面的EXTRA_SPACE则是不能被应用的空间。lua_State中的top指针，则是在函数调用的过程中，动静扭转的，它标记着正在被调用函数的栈顶地位。另外还要强调的一点，则是CallInfo的func指针，本质上是指向一个函数实例（base_ci除外），而这个被func指针指向的地位，是不能作为栈顶存在的，也就是说，以后函数在被调用时，如果它是空栈，那么lua_State的top指针将落在L->ci->func的上一格地位。正如上图所示，当初它是一个空栈。

在实现虚拟机状态实例创立当前，咱们须要往lua_State的栈中，Push咱们心愿被调用的函数，这个函数在咱们应用的例子中，就是add_op，咱们通过一张图展现，在luaL_pushcfunction执行完当前的状态：

目前看起来平平无奇，接下来将两个参数入栈，于是失去函数调用前的栈状态：

在实现参数入栈当前，咱们就须要开始调用add_op这个函数了，调用它的形式是执行luaL_pcall(L, 2, 1)这行代码，这两个参数别离示意，咱们传入两个参数，并且期待一个返回值。函数调用的过程略微有点简单，然而绝对于前面波及到的虚拟机运作，还算是小巫见大巫。要开始函数调用，首先要构建新的CallInfo实例，它会指定add_op运行时，该函数栈能够应用的范畴同时也蕴含，这个函数被期待返回多少个函数，于是咱们能够失去如下图所示的状态：

从图中咱们能够看到，新创建的CallInfo对象归属于add_op这个函数，CallInfo的func指针指向了add_op这个函数的地位，同时新创建的CallInfo对象的func和top指针限定了add_op可能应用的栈空间的范畴。同时咱们也能够察看到lua_State数据实例的ci指针指向了新创建的CallInfo实例，函数调用完结后，它会指向上一个CallInfo数据实例，ci指针实质就是用来标记以后调用的是哪个函数。在实现CallInfo创立当前，就能够开始调用add_op这个函数了。在开始调用之前，咱们先来看看栈的索引，咱们能够察看到如下图所示，当索引为正时，add_op函数栈的栈底从1开始，并且朝栈顶递增，如果索引为正数时，add_op函数栈的栈顶从-1开始，并且朝栈底递加。

在理解了栈索引的操作当前，add_op外部的操作也就清晰明了了，就是把两个参数取出相加当前入栈（add_op最初的return 1，则示意add_op实际上有一个返回值），于是失去如下图所示的状态：

当初进入到add_op函数的最初调用阶段，就是销毁以后的CallInfo实例，并且将返回值移到add_op的地位（大家能够尝试推导一下多个返回值的状况），于是失去下图的状态

当初控制权又回到了main函数了，main函数间接将栈顶变量取出打印，而后是把add_op的返回值出栈，于是咱们就实现了残缺的函数调用。

函数调用实现

创立虚拟机实例
在实现展示逻辑图当前，咱们当初开始着手实现具体的逻辑。本节将逐渐设计和实现上节援用例子的各个步骤，首先咱们要实现的是luaL_newstate接口，这个接口我定义在clib/luaaux.h clib/luaaux.c中，它的定义和实现如下所示：

// clib/luaaux.h

struct lua_State* luaL_newstate();

// clib/luaaux.c
static void* l_alloc(void* ud, void* ptr, size_t osize, size_t nsize) {
    (void)ud;
    (void)osize;

    // printf("l_alloc nsize:%ld\n", nsize);
    if (nsize == 0) {
        free(ptr);
        return NULL;
    }

    return realloc(ptr, nsize);
}

struct lua_State* luaL_newstate() {
    struct lua_State* L = lua_newstate(&l_alloc, NULL);
    return L;
}

如上所示，luaL_newstate实际上是转调了另一个库的接口lua_newstate，luaL_newstate为其指定了一个内存调配函数l_alloc。而咱们的lua_newstate函数则定义在common/luastate.h common/luastate.c中，它们的定义是：

// common/luastate.h
#define LUA_EXTRASPACE sizeof(void*) 
#define G(L) ((L)->l_G)

struct lua_State* lua_newstate(lua_Alloc alloc, void* ud);

// common/luastate.c
struct lua_State* lua_newstate(lua_Alloc alloc, void* ud) {
    struct global_State* g;
    struct lua_State* L;

    struct LG* lg = (struct LG*)(*alloc)(ud, NULL, LUA_TTHREAD, sizeof(struct LG));
    if (!lg) {
        return NULL;
    }
    g = &lg->g;
    g->ud = ud;
    g->frealloc = alloc;
    g->panic = NULL;

    L = &lg->l.l;
    G(L) = g;
    g->mainthread = L;

    stack_init(L);

    return L;
}

lua_newstate实际上是为global_State和lua_State开拓内存，并实现初始化。这里lua_newstate应用了从luaL_newstate传入的内存调配函数，这个函数的作用和C语言中的realloc相似，然而它规定，当nsize（意为new size）为0时，要将内存开释掉。对于realloc（Reference 2）这个函数，应用它十分不便，它的作用是先开拓nsize的内存，将旧的内容拷贝到新的内存块后再开释原来的内存，省去了咱们手工解决的逻辑。而开拓内存自身，咱们能够留神到，它并不是独自为global_State和lua_State开拓内存，而是应用了一个叫做LG的数据结构：

// common/luastate.c
typedef struct LX {
    lu_byte extra_[LUA_EXTRASPACE];
    lua_State l;
} LX;

typedef struct LG {
    LX l;
    global_State g;
} LG;

这是参照官网版本做的设计，咱们能够看到这里整合了一个global_State变量和一个LX变量，LX构造蕴含了一个lua_State类型的变量和一个LUA_EXTRASPACE大小的lu_byte数组变量extra_，这个变量我在官网版本中没有搜到应用到他的中央，兴许是个历史遗留问题。至于为什么要通过一个LG构造，将global_State和lua_State绑定在一起？这里我在云风的《lua源码观赏》找到这样的解释（Reference 3）：

Lua的实现尽可能的防止内存碎片，同时也缩小内存调配和开释的次数。它采纳了一个小技巧，利用一个LG构造，把主线程lua_State和global_State调配在一起。

余下的逻辑就是global_State和lua_State的初始化操作，对于lua_State而言，它还须要进行栈相干的初始化stack_init：

// luastate.c
static void stack_init(struct lua_State* L) {
    L->stack = (StkId)luaM_realloc(L, NULL, 0, LUA_STACKSIZE * sizeof(TValue));
    L->stack_size = LUA_STACKSIZE;
    L->stack_last = L->stack + LUA_STACKSIZE - LUA_EXTRASTACK;
    L->next = L->previous = NULL;
    L->status = LUA_OK;
    L->errorjmp = NULL;
    L->top = L->stack;
    L->errorfunc = 0;

    int i;
    for (i = 0; i < L->stack_size; i++) {
        setnilvalue(L->stack + i);
    }
    L->top++;

    L->ci = &L->base_ci;
    L->ci->func = L->stack;
    L->ci->top = L->stack + LUA_MINSTACK;
    L->ci->previous = L->ci->next = NULL;
}

这里他为lua_State开拓LUA_STACKSIZE（官网定义40）大小的栈，并且设定了L->top不能拜访的区域，即stack_last以及往后的EXTRA_SPACE局部。至于EXTRA_SPACE的作用，我集体的观点是防止爆栈时（L->top指针超过L->stack_last），拜访了其余内存区域毁坏其余内存块，这里被作为一个容错的缓冲区。其余局部则是各个变量的初始化，包含为base_ci赋初值（限定栈范畴等）。间接通过调用global_State的frealloc函数来开拓内存，是十分繁琐的，而且还可能遇到内存不足的状况，遇到这种状况为每一个调用内存的中央做NULL指针断定是相当冗余的，于是我在common/luamem.h common/luamem.c中定义了一个luaM_realloc接口，M代表memory：

// luamem.h
void* luaM_realloc(struct lua_State* L, void* ptr, size_t osize, size_t nsize);

// luamem.c
void* luaM_realloc(struct lua_State* L, void* ptr, size_t osize, size_t nsize) {
    struct global_State* g = G(L);
    int oldsize = ptr ? osize : 0;

    void* ret = (*g->frealloc)(g->ud, ptr, oldsize, nsize);
    if (ret == NULL) {
        luaD_throw(L, LUA_ERRMEM);
    }

    return ret;
}

这个接口只是多做了一个NULL指针断定，当内存申请失败时，调用luaD_throw抛出异样，这个luaD_throw前面介绍以保护模式调用函数时会进行阐明。走到这一步咱们的luaL_newstate流程也实现了，它的状态就是下图所示的那样。

销毁虚拟机实例
在介绍完创立虚拟机状态后，就须要相应地介绍销毁虚拟机状态的接口，这个就是咱们要实现的luaL_close函数，和luaL_newstate一样，它定义在clib/luaaux.h clib/luaaux.c中：

// clib/luaaux.h
void luaL_close(struct lua_State* L);

// clib/luaaux.c
void luaL_close(struct lua_State* L) {
    lua_close(L);
}

它同样是转调common/luastate.h里的接口：

// common/luastate.h
void lua_close(struct lua_State* L);

// common/luastate.c
#define fromstate(L) (cast(LX*, cast(lu_byte*, (L)) - offsetof(LX, l)))

static void free_stack(struct lua_State* L) {
    global_State* g = G(L);
    (*g->frealloc)(g->ud, L->stack, sizeof(TValue), 0);
    L->stack = L->stack_last = L->top = NULL;
    L->stack_size = 0;
}

void lua_close(struct lua_State* L) {
    struct global_State* g = G(L);
    struct lua_State* L1 = g->mainthread; // only mainthread can be close

    // because I have not implement gc, so we should free ci manual 
    struct CallInfo* ci = &L1->base_ci;
    while(ci->next) {
        struct CallInfo* next = ci->next->next;
        struct CallInfo* free_ci = ci->next;

        (*g->frealloc)(g->ud, free_ci, sizeof(struct CallInfo), 0);
        ci = next;
    }

    free_stack(L1);    
    (*g->frealloc)(g->ud, fromstate(L1), sizeof(LG), 0);
}

整个逻辑很简略，先把CallInfo实例开释掉，而后再把lua_State的stack开释掉，最初把整个LG开释掉（下面曾经解释过他是蕴含global_State和lua_State类型的构造）。这里须要留神的一点，则是宏fromstate，他实际上是通过luaState指针L，通过offsetof函数，找到LG的起始地位，最终将整个LG开释掉，而offsetof须要咱们指定类或构造体中成员的名称，offsetof函数承受两个参数，第一个是类或构造体的名称，第二个是成员变量名，将第一个成员变量名传入，咱们会取得0。因为fromstate这个宏中的offsetof调用，是将LX的成员l传入，因而offsetof取得的值就是sizeof(extra)，对于lua_State L而言，他正好能找到LG的起始地址，因而能够通过这种形式一并将lua_State和global_State开释。

参数入栈
参数入栈其实就是将指定类型的值Push到栈中，为此我实现了luaL_pushinteger、luaL_pushnumber、luaL_pushlightuserdata、luaL_pushnil、luaL_pushcfunction和luaL_pushboolean，这些函数都在clib/luaaux.h clib/luaaux.c中，他们同样是转调common/luastate.h common/luastate.c的接口，这里就不一一列举他们的实现了。Push的操作也很简略，其实就是对L->top指向的地位赋值，而后L->top++，因而咱们首先要对每种类型都实现一个set函数：

// common/luastate.h
void setivalue(StkId target, int integer);
void setfvalue(StkId target, lua_CFunction f);
void setfltvalue(StkId target, float number);
void setbvalue(StkId target, bool b);
void setnilvalue(StkId target);
void setpvalue(StkId target, void* p);

void setobj(StkId target, StkId value);

// common/luastate.c
void setivalue(StkId target, int integer) {
    target->value_.i = integer;
    target->tt_ = LUA_NUMINT;
}

void setfvalue(StkId target, lua_CFunction f) {
    target->value_.f = f;
    target->tt_ = LUA_TLCF;
}

void setfltvalue(StkId target, float number) {
    target->value_.n = number;
    target->tt_ = LUA_NUMFLT;
}

void setbvalue(StkId target, bool b) {
    target->value_.b = b ? 1 : 0;
    target->tt_ = LUA_TBOOLEAN;
}

void setnilvalue(StkId target) {
    target->tt_ = LUA_TNIL;
}

void setpvalue(StkId target, void* p) {
    target->value_.p = p;
    target->tt_ = LUA_TLIGHTUSERDATA;
}

void setobj(StkId target, StkId value) {
    target->value_ = value->value_;
    target->tt_ = value->tt_;
}

之前咱们介绍过TValue，这里其实就是为每一种类型的域赋值，并且为其加上类型，性能简略没有什么要阐明的，对于push函数，这里仅举一例lua_pushinteger，其余的实现办法相似，大家能够间接去dummylua的工程里找。

// common/luastate.h
void increase_top(struct lua_State* L);
void lua_pushinteger(struct lua_State* L, int integer);

// common/luastate.c
void increase_top(struct lua_State* L) {
    L->top++;
    assert(L->top <= L->ci->top);    
}

void lua_pushinteger(struct lua_State* L, int integer) {
    setivalue(L->top, integer);
    increase_top(L);
}

出栈
出栈操作非常简单，只须要让L->top–，同时要留神top指针不要<=L->ci->func：

// common/luastate.h
void lua_settop(struct lua_State* L, int idx);
int lua_gettop(struct lua_State* L);
void lua_pop(struct lua_State* L);

// common/luastate.c
int lua_gettop(struct lua_State* L) {
    return cast(int, L->top - (L->ci->func + 1));
}

void lua_settop(struct lua_State* L, int idx) {
    StkId func = L->ci->func;
    if (idx >=0) {
        assert(idx <= L->stack_last - (func + 1));
        while(L->top < (func + 1) + idx) {
            setnilvalue(L->top++);
        }
        L->top = func + 1 +idx;
    }
    else {
        assert(L->top + idx > func);
        L->top = L->top + idx;
    }
}

void lua_pop(struct lua_State* L) {
    lua_settop(L, -1);
}

这里引入了设置栈顶指针的函数settop，逻辑也十分直观，这里不作解释。

获取栈上的值
获取栈上的值，实际上就是要传入栈的索引，而后获取他的值，通常咱们须要该地位的值是什么类型，因而通常是一个尝试性的操作，如lua_tointeger(L, -1)是尝试将栈顶(L->top – 1)的值转成integer类型，期间可能胜利，也可能失败，这里仅举lua_tointeger的例子，其余局部能够到dummylua工程里查阅。

// clib/luaaux.h
lua_Integer luaL_tointeger(struct lua_State* L, int idx);

// clib/luaaux.c
lua_Integer luaL_tointeger(struct lua_State* L, int idx) {
    int isnum = 0;
    lua_Integer ret = lua_tointegerx(L, idx, &isnum);
    return ret;
}

// common/luastate.h
lua_Integer lua_tointegerx(struct lua_State* L, int idx, int* isnum);

// common/luastate.c
static TValue* index2addr(struct lua_State* L, int idx) {
    if (idx >= 0) {
        assert(L->ci->func + idx < L->ci->top);
        return L->ci->func + idx;
    }
    else {
        assert(L->top + idx > L->ci->func);
        return L->top + idx;
    }
}

lua_Integer lua_tointegerx(struct lua_State* L, int idx, int* isnum) {
    lua_Integer ret = 0;
    TValue* addr = index2addr(L, idx); 
    if (addr->tt_ == LUA_NUMINT) {
        ret = addr->value_.i;
        *isnum = 1;
    }
    else {
        *isnum = 0;
        LUA_ERROR(L, "can not convert to integer!\n");
    }

    return ret;
}

luaL_pcall实现
在开始介绍pcall之前，咱们先来看看不在保护模式下的函数调用逻辑是怎么实现的，这一些列操作蕴含在luaD_call函数内，它被定义在vm/luado.h vm/luado.c上：

// vm/luado.h
int luaD_call(struct lua_State* L, StkId func, int nresult);

// vm/luado.c
int luaD_call(struct lua_State* L, StkId func, int nresult) {
    if (++L->ncalls > LUA_MAXCALLS) {
        luaD_throw(L, 0);
    }

    if (!luaD_precall(L, func, nresult)) {
        // TODO luaV_execute(L);
    }

    L->ncalls--;
    return LUA_OK;
}

其中的func参数，指定了要被调用函数的栈地址，而nresult则指定了这个函数被冀望返回多少个返回值。这里并没有间接执行func，而是调用了一个luaD_precall为函数调用做筹备，这个函数次要预处理Lua函数调用的状况，如果调用的是light c function，那么就是间接执行，而不必进入到后续章节咱们将实现的luaV_execute中去执行虚拟机指令。这个函数同样定义在vm/luado.h 和vm/luado.c中：

// vm/luado.h
int luaD_precall(struct lua_State* L, StkId func, int nresult);

// vm/luado.c 
// prepare for function call. 
// if we call a c function, just directly call it
// if we call a lua function, just prepare for call it
int luaD_precall(struct lua_State* L, StkId func, int nresult) {
    switch(func->tt_) {
        case LUA_TLCF: {
            lua_CFunction f = func->value_.f;

            ptrdiff_t func_diff = savestack(L, func);
            luaD_checkstack(L, LUA_MINSTACK);           // 查看lua_State的空间是否短缺，如果不短缺，则须要扩大
            func = restorestack(L, func_diff);

            next_ci(L, func, nresult);                        
            int n = (*f)(L);                            // 对func指向的函数进行调用，并获取理论返回值的数量
            assert(L->ci->func + n <= L->ci->top);
            luaD_poscall(L, L->top - n, n);             // 解决返回值
            return 1; 
        } break;
        default:break;
    }

    return 0;
}

目前我只解决了LUA_TLCF也就是light c function这一种状况。调用func之前，首先会检查一下lua_State的栈是否空间短缺，如果新创建的CallInfo的top指针，不能在lua_State栈的无效范畴之内，那么栈就要裁减，通常是裁减为原来的两倍，这一段逻辑写在luaD_checkstack内，大家能够间接到dummylua工程里查看，这里就不列举了。这里须要留神的是，拓展栈须要申请一块新的内存空间，因而L->stack的地址也会扭转，在裁减之后，须要修改func所指向的地址。实现这一系列的操作之后，就是为调用func创立一个CallInfo实例，大家能够将上面这段代码和之前展现的逻辑图分割起来，就能很好得了解了。

static struct CallInfo* next_ci(struct lua_State* L, StkId func, int nresult) {
    struct global_State* g = G(L);
    struct CallInfo* ci;
    ci = luaM_realloc(L, NULL, 0, sizeof(struct CallInfo));
    ci->next = NULL;
    ci->previous = L->ci;
    L->ci->next = ci;
    ci->nresult = nresult;
    ci->callstatus = LUA_OK;
    ci->func = func;
    ci->top = L->top + LUA_MINSTACK;
    L->ci = ci;

    return ci;
}

接下来就是对func函数进行调用，调用实现后，他会返回一个值n，通知咱们他理论有多少个返回值，而后须要依据这个n值对返回值进行解决，这些解决逻辑实现在vm/luado.h vm/luado.c中的luaD_poscall函数中：

// vm/luado.h
int luaD_poscall(struct lua_State* L, StkId first_result, int nresult);

// vm/luado.c
int luaD_poscall(struct lua_State* L, StkId first_result, int nresult) {
    StkId func = L->ci->func;
    int nwant = L->ci->nresult;

    switch(nwant) {
        case 0: {
            L->top = L->ci->func;
        } break;
        case 1: {
            if (nresult == 0) {
                first_result->value_.p = NULL;
                first_result->tt_ = LUA_TNIL;
            }
            setobj(func, first_result);
            first_result->value_.p = NULL;
            first_result->tt_ = LUA_TNIL;

            L->top = func + nwant;
        } break;
        case LUA_MULRET: {
            int nres = cast(int, L->top - first_result);
            int i;
            for (i = 0; i < nres; i++) {
                StkId current = first_result + i;
                setobj(func + i, current);
                current->value_.p = NULL;
                current->tt_ = LUA_TNIL;
            }
            L->top = func + nres;
        } break;
        default: {
            if (nwant > nresult) {
                int i;
                for (i = 0; i < nwant; i++) {
                    if (i < nresult) {
                        StkId current = first_result + i;
                        setobj(func + i, current);
                        current->value_.p = NULL;
                        current->tt_ = LUA_TNIL;
                    }
                    else {
                        StkId stack = func + i;
                        stack->tt_ = LUA_TNIL;
                    }
                }
                L->top = func + nwant;
            }
            else {
                int i;
                for (i = 0; i < nresult; i++) {
                    if (i < nwant) {
                        StkId current = first_result + i;
                        setobj(func + i, current);
                        current->value_.p = NULL;
                        current->tt_ = LUA_TNIL;
                    }
                    else {
                        StkId stack = func + i;
                        stack->value_.p = NULL;
                        stack->tt_ = LUA_TNIL; 
                    }
                }
                L->top = func + nresult;
            } 
        } break;
    }

    struct CallInfo* ci = L->ci;
    L->ci = ci->previous;
    L->ci->next = NULL;

    // because we have not implement gc, so we should free ci manually
    struct global_State* g = G(L);
    (*g->frealloc)(g->ud, ci, sizeof(struct CallInfo), 0); 

    return LUA_OK;
}

函数第二个参数first_result记录了第一个返回值在栈中的地位，而第三个参数nresult则指明了理论的返回值数量。很多状况下，咱们调用函数时，期待的返回值数量nwant和理论的返回值数量nresult是不一样的，因而在luaD_poscall函数里须要对各种状况进行解决。如果咱们不期待有返回值，也就是nwant为0，那么理论的返回值不论有多少个都会被抛弃，此时L->top指针也会指向L->ci->func的地位，函数以及之前Push进来的参数都会被出栈。当咱们期待只有一个返回值时，返回值后果会被挪动到L->ci->func的地位，如果理论没有返回值，他就会被设置为NIL。当咱们期待的返回值比理论的返回值多时，短少的局部会被NIL值补足。当咱们期待的返回值比理论少时，多进去的会被抛弃。这里还有一个非凡的状况，就是nwant为LUA_MULRET的状况，这种状况就是理论有多少个返回值，他就返回多少个，不会抛弃，事实上LUA_MULRET的值是-1。通过一系列操作，对于被调用者而言当初栈上存在的不再是被调用函数本人的参数，而是被调用函数留下的返回值。

形容C函数在栈上的调用流程，是十分难写的，这也是为什么在探讨具体实现之前，先通过图的形式在概念上展现这个流程，目标是为了让大家有宏观上的感知，如果能了解上节的内容，那么这章节的内容也不难理解，尽管他可能很干燥。在实现函数调用的实现当前，咱们还须要探讨的一个货色，就是在保护模式下进行函数调用。事实上提供给内部应用的函数调用接口是luaL_pcall，也就是默认所有的C函数调用都应该在保护模式下进行，他的定义如下所示：

// clib/luaaux.h
int luaL_pcall(struct lua_State* L, int narg, int nresult);

// clib/luaaux.c
// function call
typedef struct CallS {
    StkId func;
    int nresult;
} CallS;

static int f_call(lua_State* L, void* ud) {
    CallS* c = cast(CallS*, ud);
    luaD_call(L, c->func, c->nresult);
    return LUA_OK;
}

int luaL_pcall(struct lua_State* L, int narg, int nresult) {
    int status = LUA_OK;
    CallS c;
    c.func = L->top - (narg + 1);
    c.nresult = nresult; 

    status = luaD_pcall(L, &f_call, &c, savestack(L, L->top), 0);
    return status;
}

luaL_pcall接口只是让使用者填入，被调用的函数有多少个参数，以及冀望有多少个返回值，luaL_pcall是通过narg这个示意参数个数的值，推断出被调用函数在栈中的地位，并且调用另一个函数luaD_pcall，咱们能够察看到，这里一并将f_call函数传入到luaD_pcall中，在保护模式下执行f_call，实际上就是执行咱们刚刚探讨的luaD_call。调用luaD_pcall，除了须要传入理论执行栈函数调用的f_call以外，咱们还须要传入一个CallS类型的变量c，这个变量会在f_call中应用到，其实是保留调用信息长期数据的一个构造。此外咱们还须要传入栈顶在函数调用前的地位，用于异样后复原栈之用。上面咱们来看看luaD_pcall的定义：

// vm/luado.h
int luaD_pcall(struct lua_State* L, Pfunc f, void* ud, ptrdiff_t oldtop, ptrdiff_t ef);

// vm/luado.c
int luaD_pcall(struct lua_State* L, Pfunc f, void* ud, ptrdiff_t oldtop, ptrdiff_t ef) {
    int status;
    struct CallInfo* old_ci = L->ci;
    ptrdiff_t old_errorfunc = L->errorfunc;    

    status = luaD_rawrunprotected(L, f, ud);
    if (status != LUA_OK) {
        // because we have not implement gc, so we should free ci manually
        struct global_State* g = G(L);
        struct CallInfo* free_ci = L->ci;
        while(free_ci) {
            if (free_ci == old_ci) {
                free_ci = free_ci->next;
                continue;
            }

            struct CallInfo* previous = free_ci->previous;
            previous->next = NULL;

            struct CallInfo* next = free_ci->next;
            (*g->frealloc)(g->ud, free_ci, sizeof(struct CallInfo), 0);
            free_ci = next;
        }

        L->ci = old_ci;
        L->top = restorestack(L, oldtop);
        seterrobj(L, status);
    }

    L->errorfunc = old_errorfunc; 
    return status;
}

咱们的f_call最终会在luaD_rawrunprotected中被调用，而在调用之前，咱们须要对栈的一些信息进行保留，包含栈以后调用的是哪个函数（保留ci），栈以后的谬误处理函数处于哪个地位。而一旦调用失败，咱们就须要复原原来栈的状态。

当初咱们来看看luaD_rawrunprotected的定义：

// vm/luado.h
int luaD_rawrunprotected(struct lua_State* L, Pfunc f, void* ud);

// vm/luado.c

#define LUA_TRY(L, c, a) if (_setjmp((c)->b) == 0) { a } 

#ifdef _WINDOWS_PLATFORM_ 
#define LUA_THROW(c) longjmp((c)->b, 1) 
#else 
#define LUA_THROW(c) _longjmp((c)->b, 1) 
#endif 

struct lua_longjmp {
    struct lua_longjmp* previous;
    jmp_buf b;
    int status;
};

int luaD_rawrunprotected(struct lua_State* L, Pfunc f, void* ud) {
    int old_ncalls = L->ncalls;
    struct lua_longjmp lj;
    lj.previous = L->errorjmp;
    lj.status = LUA_OK;
    L->errorjmp = &lj;

    LUA_TRY(
        L,
        L->errorjmp,
        (*f)(L, ud);
    )

    L->errorjmp = lj.previous;
    L->ncalls = old_ncalls;
    return lj.status;
}

这里咱们定义了一个lua_longjmp的构造，这是用来辅助咱们解决异常情况用的。在初始化lua_State的时候，咱们的errorjmp的值为NULL，errorjmp是否为NULL是判断以后函数是否处于保护模式的重要指标，这个咱们前面会提到。咱们的f_call函数，是在LUA_TRY这个宏里被调用的，而这个宏的作用是什么呢？因为/C语言没有try catch机制，因而咱们须要通过一种形式来模仿try catch机制来捕获异样，这里就须要用到咱们的setjmp和longjmp函数了。setjmp和longjmp是什么接口？咱们来援用Linux man page longjmp的一段阐明：

Description
longjmp() and setjmp(3) are useful for dealing with errors and interrupts encountered in a low-level subroutine of a program. longjmp() restores the environment saved by the last call of setjmp(3) with the corresponding env argument. After longjmp() is completed, program execution continues as if the corresponding call of setjmp(3) had just returned the value val. longjmp() cannot cause 0 to be returned. If longjmp() is invoked with a second argument of 0, 1 will be returned instead.siglongjmp() is similar to longjmp() except for the type of its env argument. If, and only if, the sigsetjmp(3) call that set this env used a nonzero savesigs flag, siglongjmp() also restores the signal mask that was saved by sigsetjmp(3).

是不是看着很晕？那咱们就通过一个例子来加以解释和阐明：

#include <stdio.h>
#include <assert.h>
#include <setjmp.h>

jmp_buf b;

int main(void) { 
    int ret = setjmp(b);
    printf("setjmp result = %d\n", ret);

    if (ret == 0)
        longjmp(b, 1);

    return 0;
}

此时的输入是：

setjmp result = 0
setjmp result = 1

为什么printf函数会被调用两次？答案是咱们第一次调用setjmp的时候，将以后的栈信息保留在了jmp_buf变量b中，并且返回0值，此时程序继续执行，这时候因为返回值ret为0，因而咱们会调用longjmp函数。这个longjmp函数会复原jmp_buf变量b中记录的环境，因而程序会跳回到setjmp调用的中央，并且longjmp还将第二个参数1，带给了setjmp，并作为其第二次调用的返回值。利用这种个性，咱们能够模仿C++的try catch机制，上面再举个例子：

#include <stdio.h>
#include <assert.h>
#include <setjmp.h>

int except = 0;
jmp_buf b;

void foo() {
    printf("foo\n");
    longjmp(b, 1);
}

int main(void) { 
    if ((except = setjmp(b)) == 0) {
        foo();
    }
    else {
        printf("except type %d\n", except);
    }

    return 0;
}

// 输入
foo
except type 1

把setjmp(b)不为0时，执行的局部，作为捕获异样的逻辑，把longjmp作为throw函数应用，回顾一下咱们的LUA_TRY和LUA_THROW宏，是不是有一种殊途同归之妙？当然，咱们不会间接在被调用的函数里，产生异样时间接调用LUA_THROW宏，而是应用另一个接口luaD_throw：

// vm/luado.h
void luaD_throw(struct lua_State* L, int error);

// vm/luado.c
void luaD_throw(struct lua_State* L, int error) {
    struct global_State* g = G(L);
    if (L->errorjmp) {
        L->errorjmp->status = error;
        LUA_THROW(L->errorjmp);
    }
    else {
        if (g->panic) {
            (*g->panic)(L);
        }
        abort();
    }
}

这个函数，依据L->errorjmp的值，判断以后函数是否处于保护模式中，处于与不处于解决的形式是不雷同的，如果L->errorjmp为非NULL值，那阐明函数是在LUA_TRY的包裹下执行的，因而能够调用LUA_THROW跳出以后的调用，如果不是，那么则调用之前设置好的panic函数（如果有），而后退出过程。

到目前为止，函数调用和保护模式的代码咱们均已实现。

结束语

这篇文章篇幅较长，然而咱们的指标是清晰的，设计和实现Lua根本数据结构、栈和基于栈的C函数调用的设计与实现，并对这些内容进行了不同水平的解析。只管咱们当初并未波及到任何编译器和虚拟机指令相干的内容，然而以后的内容是了解后续内容的根底，也是关键所在，心愿后续内容可能给大家带来更精彩的内容。

Reference

The Lua Architecture 图片位于Lua: An Embedded Script Language这个章节中：Figure 1: process of initializing Lua and loading a script file
realloc
a) expanding or contracting the existing area pointed to by ptr, if possible. The contents of the area remain unchanged up to the lesser of the new and old sizes. If the area is expanded, the contents of the new part of the array are undefined. b) allocating a new memory block of size new_size bytes, copying memory area with size equal the lesser of the new and the old sizes, and freeing the old block.
Lua源码观赏 2.2 全局状态机

这是侑虎科技第1300篇文章，感激作者Manistein供稿。欢送转发分享，未经作者受权请勿转载。如果您有任何独到的见解或者发现也欢送分割咱们，一起探讨。（QQ群：465082844）

作者主页：https://manistein.github.io/b…

再次感激Manistein的分享，如果您有任何独到的见解或者发现也欢送分割咱们，一起探讨。（QQ群：465082844）

关于lua:构建Lua解释器虚拟机的基础

前言

目录构造

根本数据结构

函数调用流程

函数调用实现

结束语

Reference

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于lua:构建Lua解释器虚拟机的基础

前言

目录构造

根本数据结构

函数调用流程

函数调用实现

结束语

Reference

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复