关于前端:CPU内部的奥秘代码是如何被执行的

咱们是袋鼠云数栈 UED 团队，致力于打造优良的一站式数据中台产品。咱们始终保持工匠精力，摸索前端路线，为社区积攒并流传教训价值。

本文作者：景明

咱们以一段 C 代码为例，来看一下代码被编译成二进制可执行程序之后，是如何被 CPU 执行的。

在这段代码中，只是做了非常简单的加法操作，将 x 和 y 两个数字相加失去 z，并返回后果 z。

int main() {
    int x = 1;
    int y = 2;
    int z = x + y;
    return z;
}

咱们晓得，CPU 并不能间接执行这段 C 代码，而是须要对其进行编译，将其转换为二进制的机器码，而后 CPU 能力依照程序执行编译后的机器码。

先通过 GCC 编译器将这段 C 代码编译成二进制文件，输出以下命令让其编译成目标文件：

gcc -O0 -o code_prog code.c

输出下面的命令之后回车，在文件夹中生成名为 code_prog 的可执行程序，接下来再将编译进去的 code_prog 程序进行反汇编，这样就能够看到二进制代码和对应的汇编代码。能够应用 objdump 的实现该工作，命令如下所示：

objdump -d code_prog

最初编译进去的机器码如下：

0000000100003f84 <_main>:
100003f84: ff 43 00 d1        sub    sp, sp, #16            // 开拓栈空间。即开拓了四个 4 字节空间
100003f88: ff 0f 00 b9        str    wzr, [sp, #12]         // 将 wzr 寄存器的数据存储到 sp 寄存器的 #12 地址上，设为0
100003f8c: 28 00 80 52        mov    w8, #1                 // 创立一个 x = 1，并将 1 存入 w8 寄存器中
100003f90: e8 0b 00 b9        str    w8, [sp, #8]           // 将 w8 寄存器的数据存入 sp 寄存器中 #8 的地址中，也就是将 x = 1 存入
100003f94: 48 00 80 52        mov    w8, #2                 // 创立一个 y = 2，并将 2 存入 w8 寄存器中
100003f98: e8 07 00 b9        str    w8, [sp, #4]           // 将 w8 寄存器的数据存入 sp 寄存器中 #4 的地址中，也就是将 y = 2 存入
100003f9c: e8 0b 40 b9        ldr    w8, [sp, #8]           // 读取 sp 寄存器中 #8 的数据存入 w8 寄存器中，也就是获取 x = 1
100003fa0: e9 07 40 b9        ldr    w9, [sp, #4]           // 读取 sp 寄存器中 #4 的数据存入 w9 寄存器中，也就是获取 y = 2
100003fa4: 08 01 09 0b        add    w8, w8, w9             // 将 w8、w9 寄存器的 x,y 数据进行相加，并存入 w8 寄存器中，也就是 z = 3
100003fa8: e8 03 00 b9        str    w8, [sp]               // 将 w8 寄存器的数据存入 sp 寄存器中
100003fac: e0 03 40 b9        ldr    w0, [sp]               // 读取 sp 寄存器中的数据存到 w0 寄存器中。z = 3
100003fb0: ff 43 00 91        add    sp, sp, #16            // 清空开拓的栈空间
100003fb4: c0 03 5f d6        ret                        // 返回后果

PS: wzr 为 32 的零寄存器，专门用来清零，也就是 sp 上 #12 指向的数据设置为 0

察看上方，右边就是编译生成的机器码，在这里它是应用十六进制来展现的，这次要是因为十六进制比拟容易浏览，所以通常应用十六进制来展现二进制代码。

能够察看到上图是由很多行组成的，每一行都是一个指令，该指令能够让 CPU 执行指定的工作。

两头的局部是汇编代码，例如本来是二进制示意的指令，在汇编代码中能够应用单词来示意，比方 mov、add 就别离示意数据的存储和相加。

通常将汇编语言编写的程序转换为机器语言的过程称为“汇编”；反之，机器语言转化为汇编语言的过程称为“反汇编”，比方上图就是对 code_prog 过程进行了反汇编操作。

左边增加的正文，示意每条指令的具体含意。

这一大堆指令依照程序汇合在一起就组成了程序，所以程序的执行，实质上就是 CPU 依照程序执行这一大堆指令的过程。

CPU 是怎么执行程序的？

为了更好的分析程序的执行过程，咱们还须要理解一下根底的计算机硬件信息，具体如下图：

这张图是比拟通用的零碎硬件组织模型图，它次要是由 CPU、主存储器、各种 IO 总线，还有一些外部设备组成的。

首先，在一个程序执行之前，程序须要被装进内存，比方在 macOS 上面，你能够通过鼠标点击一个可执行文件，当你点击该文件的时候，零碎中的程序加载器会将该文件加载到内存中。

CPU 能够通过指定内存地址，从内存中读取数据，或者往内存中写入数据，有了内存地址，CPU 和内存就能够有序地交互。

内存中的每个存储空间都有其对应的举世无双的地址：

在内存中，每个寄存字节的空间都有其惟一的地址，而且地址是依照程序排放的。

以结尾代码为例，这段代码会被编译成可执行文件，可执行文件中蕴含了二进制的机器码，当二进制代码被加载进了内存后，那么内存中的每条二进制代码便都有了本人对应的地址，如下图所示：

一旦二进制代码被装载进内存，CPU 便能够从内存中取出一条指令，而后剖析该指令，最初执行该指令。

把取出指令、剖析指令、执行指令这三个过程称为一个 CPU 时钟周期。CPU 是永不停歇的，当它执行实现一条指令之后，会立刻从内存中取出下一条指令，接着剖析该指令，执行该指令，CPU 始终反复执行该过程，直至所有的指令执行实现。

CPU 是怎么晓得要取出内存中的哪条指令呢？：

从上图能够看到 CPU 中有一个 PC 寄存器，它保留了将要执行的指令地址，当二进制代码被装载进了内存之后，零碎会将二进制代码中的第一条指令的地址写入到 PC 寄存器中，到了下一个时钟周期时，CPU 便会依据 PC 寄存器中的地址，从内存中取出指令。

PC 寄存器中的指令取出来之后，零碎要做两件事：第一件是将下一条指令的地址更新到 PC 寄存器中，如下图所示：

更新了 PC 寄存器之后，CPU 就会立刻做第二件事，那就是剖析该指令，并辨认出不同的类型的指令，以及各种获取操作数的办法。

在指令剖析实现之后，就要执行指令了。

在执行指令前，咱们还须要认识一下 CPU 中的重要部件：寄存器。

寄存器

寄存器是 CPU 中用来存放数据的设施，不同处理器中寄存器的个数也是不一样的，之所要寄存器，是因为 CPU 拜访内存的速度很慢，所以 CPU 就在外部增加了一些存储设备，这些设施就是寄存器。

他们的读取速度如下：

总结来说，寄存器容量小，读写速度快，内存容量大，读写速度慢。

寄存器通常用来存放数据或者内存中某块数据的地址，咱们把这个地址又称为指针，通常状况下寄存器对寄存的数据是没有特地的限度的，比方某个通用寄存器既能够存储数据，也能够存储指针。

不过因为历史起因，咱们还会将某些专用的数据或者指针存储在专用的通用寄存器中，比方 rbp 寄存器通常用来寄存栈帧指针的，rsp 寄存器用来寄存栈顶指针的，PC 寄存器用来寄存下一条要执行的指令等。

非凡寄存器

Stack Pointer register（SP）

The use of SP as an operand in an instruction, indicates the use of the current stack pointer.
指向以后栈指针。堆栈指针总是指向栈顶地位。个别堆栈的栈底不能动，所以数据入栈前要先批改堆栈指针，使它指向新的空余空间而后再把数据存进去，出栈的时候相同。

堆栈指针，随时跟踪栈顶地址，按”先进后出”的准则存取数据。

Link Register （LR）

连贯寄存器，一是用来保留子程序返回地址；二是当异样产生时，LR中保留的值等于异样产生时PC的值减4（或者减2），因而在各种异样模式下能够依据LR的值返回到异样产生前的相应地位继续执行。

Program Counter（PC）

A 64-bit Program Counter holding the address of the current instruction.
保留了将要执行的指令地址

Word Zero Register（WZR）

零寄存器，用于给int清零

tips

不同指令中寄存器后 #d 有什么区别？
[#d]在ARM代表的是一个常数表达式。
如：#0x3FC、#0、#0xF0000000、#200、#0xF0000001
都是代表着一个常数。

在 sp 寄存器中，代表的是以后栈顶指针挪动的地位。
如：

sub    sp, sp, #16；// 获取 sp 中的栈顶指针挪动 16位的地位，并把地位更新到 sp 寄存器中。实现开拓空间

在通用寄存器 W0 – W11 中，代表的操作的常数值。

mov    w8, #2，// 把常数 2 增加到 w8 寄存器中

通用寄存器

以下介绍下比拟常见的通用寄存器：

其中W0~W3 用于函数调用入参，其中，W0 还用于程序的返回值.
W4~W11用于保留局部变量。
W13为SP，时刻指向栈顶，当有数据入栈或出栈时，须要更新SP
W14为链接寄存器，次要是用作保留子程序返回的地址。
W15为PC寄存器，指向将要执行的下一条指令地址。

常见指令

mov

数据传送指令。将立刻数或寄存器(operant2)传送到指标寄存器Rd，可用于移位运算等操作。指令格局如下：

MOV{cond}{S} Rd,operand2

如:

mov w8, #1，就是往 w8 寄存器中写入 #1.

mov w8, w9，就是把 w9 寄存器的数据发送到 w8 寄存器中，最终 w8 和 w9 寄存器的数据统一。如下图：

ldr

ldr 从内存中读取数据放入寄存器中

LDR{cond}{T} Rd,<地址>;加载指定地址上的数据(字)，放入Rd中

如：

ldr w8, [sp, #8] 读取 sp 寄存器中 #8 地位的数据存入 w8 寄存器中，扭转的只有 w8 ，sp 寄存器不变

str

str 指令用于将寄存器中的数据保留到内存

STR{cond}{T} Rd,<地址>;存储数据(字)到指定地址的存储单元，要存储的数据在Rd中

如：
str w8, [sp] ，将 w8 寄存器的数据存入 sp 寄存器中

add

加法运算指令。将operand2 数据与Rn 的值相加，后果保留到Rd 寄存器。指令格局如下：

ADD{cond}{S} Rd,Rn,operand2

以 add w8, w8, w9 为例，就是把 w8、w9 寄存器的 x,y 数据进行相加，并存入 w8 寄存器中

如下图：

sub

减法运算指令。用寄存器 Rn 减去operand2。后果保留到 Rd 中。指令格局如下：

SUB{cond}{S} Rd,Rn,operand2

如：

sub R0,R0,#1 — R0=R0-1

执行过程

理解了以上的常识，咱们再来剖析一遍代码的执行过程。

在 C 程序中，CPU 会首先执行调用 main 函数，在调用 main 函数时，生成一块内存空间，用来寄存 main 函数执行过程中的数据。

sub    sp, sp, #16

将 0 写入到 #12 的字节地位上。

str    wzr, [sp, #12]

接下来给 x 附值

mov    w8, #1
str    w8, [sp, #8]

第一行指令是把 1 增加进寄存器中。第二行指令是把 1 存入 #8 地址的内存空间中。

接着给 y 附值

mov    w8, #2
str    w8, [sp, #4]

第一行指令是把 2 增加进寄存器中。第二行指令是把 2 存入 #4 地址的内存空间中。

执行完 x， y 的生成，接下来执行 z = x + y

ldr    w8, [sp, #8]
ldr    w9, [sp, #4]
add    w8, w8, w9

第一行指令取出内存空间地址为 #8 的数据，也就是 1. 第二行指令去除内存空间地址为 #4 的数据，也就是 2，第三行指令则对取出的数据进行相加操作，并将后果 3 存入寄存器中。

str    w8, [sp]
ldr    w0, [sp]

第一行指令把寄存器中的最终的数据存入内存中，第二行指令则获取内存中的后果，存入寄存器中。期待返回

add    sp, sp, #16

把开拓的空间进行清理。

ret

返回后果

总结

本文次要解说了 CPU 的执行过程，顺便理解了一下根底的计算机硬件信息，如有想法💡欢送探讨！！！

参考

-《图解 Google V8》- 李兵

关于前端:CPU内部的奥秘代码是如何被执行的

CPU 是怎么执行程序的？

寄存器

非凡寄存器

Stack Pointer register（SP）

Link Register （LR）

Program Counter（PC）

Word Zero Register（WZR）

tips

通用寄存器

常见指令

mov

ldr

str

add

sub

执行过程

总结

参考

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于前端:CPU内部的奥秘代码是如何被执行的

CPU 是怎么执行程序的？

寄存器

非凡寄存器

Stack Pointer register（SP）

Link Register （LR）

Program Counter（PC）

Word Zero Register（WZR）

tips

通用寄存器

常见指令

mov

ldr

str

add

sub

执行过程

总结

参考

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复