关于前端:CPU内部的奥秘代码是如何被执行的

咱们是袋鼠云数栈 UED 团队，致力于打造优良的一站式数据中台产品。咱们始终保持工匠精力，摸索前端路线，为社区积攒并流传教训价值。

本文作者：景明

咱们以一段 C 代码为例，来看一下代码被编译成二进制可执行程序之后，是如何被 CPU 执行的。

在这段代码中，只是做了非常简单的加法操作，将 x 和 y 两个数字相加失去 z，并返回后果 z。

int main() {
    int x = 1;
    int y = 2;
    int z = x + y;
    return z;
}

咱们晓得，CPU 并不能间接执行这段 C 代码，而是须要对其进行编译，将其转换为二进制的机器码，而后 CPU 能力依照程序执行编译后的机器码。

先通过 GCC 编译器将这段 C 代码编译成二进制文件，输出以下命令让其编译成目标文件：

gcc -O0 -o code_prog code.c

输出下面的命令之后回车，在文件夹中生成名为 code_prog 的可执行程序，接下来再将编译进去的 code_prog 程序进行反汇编，这样就能够看到二进制代码和对应的汇编代码。能够应用 objdump 的实现该工作，命令如下所示：

objdump -d code_prog

最初编译进去的机器码如下：

0000000100003f84 <_main>:
100003f84: ff 43 00 d1        sub    sp, sp, #16            // 开拓栈空间。即开拓了四个 4 字节空间
100003f88: ff 0f 00 b9        str    wzr, [sp, #12]         // 将 wzr 寄存器的数据存储到 sp 寄存器的 #12 地址上，设为 0
100003f8c: 28 00 80 52        mov    w8, #1                 // 创立一个 x = 1，并将 1 存入 w8 寄存器中
100003f90: e8 0b 00 b9        str    w8, [sp, #8]           // 将 w8 寄存器的数据存入 sp 寄存器中 #8 的地址中，也就是将 x = 1 存入
100003f94: 48 00 80 52        mov    w8, #2                 // 创立一个 y = 2，并将 2 存入 w8 寄存器中
100003f98: e8 07 00 b9        str    w8, [sp, #4]           // 将 w8 寄存器的数据存入 sp 寄存器中 #4 的地址中，也就是将 y = 2 存入
100003f9c: e8 0b 40 b9        ldr    w8, [sp, #8]           // 读取 sp 寄存器中 #8 的数据存入 w8 寄存器中，也就是获取 x = 1
100003fa0: e9 07 40 b9        ldr    w9, [sp, #4]           // 读取 sp 寄存器中 #4 的数据存入 w9 寄存器中，也就是获取 y = 2
100003fa4: 08 01 09 0b        add    w8, w8, w9             // 将 w8、w9 寄存器的 x,y 数据进行相加，并存入 w8 寄存器中，也就是 z = 3
100003fa8: e8 03 00 b9        str    w8, [sp]               // 将 w8 寄存器的数据存入 sp 寄存器中
100003fac: e0 03 40 b9        ldr    w0, [sp]               // 读取 sp 寄存器中的数据存到 w0 寄存器中。z = 3
100003fb0: ff 43 00 91        add    sp, sp, #16            // 清空开拓的栈空间
100003fb4: c0 03 5f d6        ret                        // 返回后果

PS: wzr 为 32 的零寄存器，专门用来清零，也就是 sp 上 #12 指向的数据设置为 0

察看上方，右边就是编译生成的机器码，在这里它是应用十六进制来展现的，这次要是因为十六进制比拟容易浏览，所以通常应用十六进制来展现二进制代码。

能够察看到上图是由很多行组成的，每一行都是一个指令，该指令能够让 CPU 执行指定的工作。

两头的局部是汇编代码，例如本来是二进制示意的指令，在汇编代码中能够应用单词来示意，比方 mov、add 就别离示意数据的存储和相加。

通常将汇编语言编写的程序转换为机器语言的过程称为“汇编”；反之，机器语言转化为汇编语言的过程称为“反汇编”，比方上图就是对 code_prog 过程进行了反汇编操作。

左边增加的正文，示意每条指令的具体含意。

这一大堆指令依照程序汇合在一起就组成了程序，所以程序的执行，实质上就是 CPU 依照程序执行这一大堆指令的过程。

为了更好的分析程序的执行过程，咱们还须要理解一下根底的计算机硬件信息，具体如下图：

这张图是比拟通用的零碎硬件组织模型图，它次要是由 CPU、主存储器、各种 IO 总线，还有一些外部设备组成的。

首先，在一个程序执行之前，程序须要被装进内存，比方在 macOS 上面，你能够通过鼠标点击一个可执行文件，当你点击该文件的时候，零碎中的程序加载器会将该文件加载到内存中。

CPU 能够通过指定内存地址，从内存中读取数据，或者往内存中写入数据，有了内存地址，CPU 和内存就能够有序地交互。

内存中的每个存储空间都有其对应的举世无双的地址：

在内存中，每个寄存字节的空间都有其惟一的地址，而且地址是依照程序排放的。

以结尾代码为例，这段代码会被编译成可执行文件，可执行文件中蕴含了二进制的机器码，当二进制代码被加载进了内存后，那么内存中的每条二进制代码便都有了本人对应的地址，如下图所示：

一旦二进制代码被装载进内存，CPU 便能够从内存中取出一条指令，而后剖析该指令，最初执行该指令。

把取出指令、剖析指令、执行指令这三个过程称为一个 CPU 时钟周期。CPU 是永不停歇的，当它执行实现一条指令之后，会立刻从内存中取出下一条指令，接着剖析该指令，执行该指令，CPU 始终反复执行该过程，直至所有的指令执行实现。

CPU 是怎么晓得要取出内存中的哪条指令呢？：

从上图能够看到 CPU 中有一个 PC 寄存器，它保留了将要执行的指令地址，当二进制代码被装载进了内存之后，零碎会将二进制代码中的第一条指令的地址写入到 PC 寄存器中，到了下一个时钟周期时，CPU 便会依据 PC 寄存器中的地址，从内存中取出指令。

PC 寄存器中的指令取出来之后，零碎要做两件事：第一件是将下一条指令的地址更新到 PC 寄存器中，如下图所示：

更新了 PC 寄存器之后，CPU 就会立刻做第二件事，那就是剖析该指令，并辨认出不同的类型的指令，以及各种获取操作数的办法。

在指令剖析实现之后，就要执行指令了。

在执行指令前，咱们还须要认识一下 CPU 中的重要部件：寄存器。

寄存器是 CPU 中用来存放数据的设施，不同处理器中寄存器的个数也是不一样的，之所要寄存器，是因为 CPU 拜访内存的速度很慢，所以 CPU 就在外部增加了一些存储设备，这些设施就是寄存器。

他们的读取速度如下：

总结来说，寄存器容量小，读写速度快，内存容量大，读写速度慢。

寄存器通常用来存放数据或者内存中某块数据的地址，咱们把这个地址又称为指针，通常状况下寄存器对寄存的数据是没有特地的限度的，比方某个通用寄存器既能够存储数据，也能够存储指针。

不过因为历史起因，咱们还会将某些专用的数据或者指针存储在专用的通用寄存器中，比方 rbp 寄存器通常用来寄存栈帧指针的，rsp 寄存器用来寄存栈顶指针的，PC 寄存器用来寄存下一条要执行的指令等。

The use of SP as an operand in an instruction, indicates the use of the current stack pointer.
指向以后栈指针。堆栈指针总是指向栈顶地位。个别堆栈的栈底不能动，所以数据入栈前要先批改堆栈指针，使它指向新的空余空间而后再把数据存进去，出栈的时候相同。

堆栈指针，随时跟踪栈顶地址，按 ” 先进后出 ” 的准则存取数据。

连贯寄存器，一是用来保留子程序返回地址；二是当异样产生时，LR 中保留的值等于异样产生时 PC 的值减 4（或者减 2），因而在各种异样模式下能够依据 LR 的值返回到异样产生前的相应地位继续执行。

A 64-bit Program Counter holding the address of the current instruction.
保留了将要执行的指令地址

零寄存器，用于给 int 清零

不同指令中寄存器后 #d 有什么区别？
[#d]在 ARM 代表的是一个常数表达式。
如：#0x3FC、#0、#0xF0000000、#200、#0xF0000001
都是代表着一个常数。

在 sp 寄存器中，代表的是以后栈顶指针挪动的地位。
如：

sub    sp, sp, #16；// 获取 sp 中的栈顶指针挪动 16 位的地位，并把地位更新到 sp 寄存器中。实现开拓空间

在通用寄存器 W0 – W11 中，代表的操作的常数值。

mov    w8, #2，// 把常数 2 增加到 w8 寄存器中

以下介绍下比拟常见的通用寄存器：

其中 W0~W3 用于函数调用入参，其中，W0 还用于程序的返回值.
W4~W11 用于保留局部变量。
W13 为 SP，时刻指向栈顶，当有数据入栈或出栈时，须要更新 SP
W14 为链接寄存器，次要是用作保留子程序返回的地址。
W15 为 PC 寄存器，指向将要执行的下一条指令地址。

常见指令

mov

数据传送指令。将立刻数或寄存器 (operant2) 传送到指标寄存器 Rd，可用于移位运算等操作。指令格局如下：

MOV{cond}{S} Rd,operand2

如:

mov w8, #1，就是往 w8 寄存器中写入 #1.

mov w8, w9，就是把 w9 寄存器的数据发送到 w8 寄存器中，最终 w8 和 w9 寄存器的数据统一。如下图：

ldr 从内存中读取数据放入寄存器中

LDR{cond}{T} Rd,< 地址 >; 加载指定地址上的数据(字)，放入 Rd 中

如：

ldr w8, [sp, #8] 读取 sp 寄存器中 #8 地位的数据存入 w8 寄存器中，扭转的只有 w8，sp 寄存器不变

str 指令用于将寄存器中的数据保留到内存

STR{cond}{T} Rd,< 地址 >; 存储数据 (字) 到指定地址的存储单元，要存储的数据在 Rd 中

如：
str w8, [sp]，将 w8 寄存器的数据存入 sp 寄存器中

加法运算指令。将 operand2 数据与 Rn 的值相加，后果保留到 Rd 寄存器。指令格局如下：

ADD{cond}{S} Rd,Rn,operand2

以 add w8, w8, w9 为例，就是把 w8、w9 寄存器的 x,y 数据进行相加，并存入 w8 寄存器中

如下图：

减法运算指令。用寄存器 Rn 减去 operand2。后果保留到 Rd 中。指令格局如下：

SUB{cond}{S} Rd,Rn,operand2

如：

sub R0,R0,#1 — R0=R0-1

理解了以上的常识，咱们再来剖析一遍代码的执行过程。

在 C 程序中，CPU 会首先执行调用 main 函数，在调用 main 函数时，生成一块内存空间，用来寄存 main 函数执行过程中的数据。

sub    sp, sp, #16

将 0 写入到 #12 的字节地位上。

str    wzr, [sp, #12]

接下来给 x 附值

mov    w8, #1
str    w8, [sp, #8]

第一行指令是把 1 增加进寄存器中。第二行指令是把 1 存入 #8 地址的内存空间中。

接着给 y 附值

mov    w8, #2
str    w8, [sp, #4]

第一行指令是把 2 增加进寄存器中。第二行指令是把 2 存入 #4 地址的内存空间中。

执行完 x，y 的生成，接下来执行 z = x + y

ldr    w8, [sp, #8]
ldr    w9, [sp, #4]
add    w8, w8, w9

第一行指令取出内存空间地址为 #8 的数据，也就是 1. 第二行指令去除内存空间地址为 #4 的数据，也就是 2，第三行指令则对取出的数据进行相加操作，并将后果 3 存入寄存器中。

str    w8, [sp]
ldr    w0, [sp]

第一行指令把寄存器中的最终的数据存入内存中，第二行指令则获取内存中的后果，存入寄存器中。期待返回

add    sp, sp, #16

把开拓的空间进行清理。

ret

返回后果

本文次要解说了 CPU 的执行过程，顺便理解了一下根底的计算机硬件信息，如有想法💡欢送探讨！！！

-《图解 Google V8》- 李兵

关于前端:CPU内部的奥秘代码是如何被执行的

CPU 是怎么执行程序的？

寄存器

非凡寄存器

Stack Pointer register（SP）

Link Register（LR）

Program Counter（PC）

Word Zero Register（WZR）

tips

通用寄存器

常见指令

mov

ldr

str

add

sub

执行过程

总结

参考