关于计算机基础:深入理解计算机系统汇编的流程控制

26次阅读

共计 4830 个字符,预计需要花费 13 分钟才能阅读完成。

后面咱们所讲的所有指令,代码执行程序都是一条接着一条程序的执行。然而实际上在编码过程中,会有某些构造,比方条件语句(if-else),循环语句(for,do-while)和分支语句(switch)等等,都要求有条件的执行,依据数据测试的后果来决定操作执行的程序。

在机器代码中,提供两种根本的低级机制来实现有条件的行为:测试数据值,而后依据测试的后果来扭转控制流或者数据流。

那么本篇文章咱们就来具体介绍在汇编语言中的流程管制。

1、条件码
后面咱们在 操作数批示符和数据传送指令 中介绍了整数寄存器,在 32 位 CPU 中蕴含一组 8 个存储 32 位值的寄存器,即整数寄存器。它能够存储一些地址或者整数的数据,有的用来记录某些重要的程序状态,有的则用来保留长期数据。

而这里咱们要介绍的是条件码(condition code)寄存器。它与整数寄存器不同,它是由单个位组成的寄存器,也就是它们当中的值只能为 0 或者 1。当有算术与逻辑操作产生时,这些条件码寄存器当中的值会相应的发生变化。

也就是说能够检测这些寄存器来执行条件分支指令。罕用的条件码如下:

①、CF:进位标记寄存器。最近的操作是最高位产生了进位。它能够记录无符号操作的溢出,当溢出时会被设为 1。

②、ZF:零标记寄存器,最近的操作得出的后果为 0。当计算结果为 0 时将会被设为 1。

③、SF:符号标记寄存器,最近的操作失去的后果为正数。当计算结果为正数时会被设为 1。

④、OF:溢出标记寄存器,最近的操作导致一个补码溢出(正溢出或负溢出)。当计算结果导致了补码溢出时,会被设为 1。

从下面能够看出,CF 和 OF 能够判断有符号和补码的溢出,ZF 判断后果是否为 0,SF 判断后果的符号。这是底层机器的设定,而咱们所编程用的高级语言(比方 C,Java)就是靠这四个寄存器,演化出各种各样的流程管制。

2、设置条件码
通常状况下,条件码寄存器的值无奈被动被扭转,它们大多时候是被动扭转,这算是条件码寄存器的特色。这其实了解起来并不艰难,因为条件码寄存器是 1 位的,而咱们的数据格式最低为 b,也就是 8 位,因而你无奈应用任何数据传送指令去传送一个单个位的值。

简直所有的算术与逻辑指令都会扭转条件码寄存器的值,不过扭转的前提是触发了条件码寄存器的条件。比方对于 subl % edx,% eax 这个减法指令,假如 % edx 和 % eax 寄存器的值都为 0x10,则两者相减的后果为 0,此时 ZF 寄存器将会被主动设为 1。对于其它的指令运算,都是相似的,会依据后果的不同而设置不同的条件码寄存器。

这里咱们须要阐明的是,leal 指令作为地址计算的时候,是不扭转任何条件码的。

后面咱们所讲的算术逻辑指令,在扭转整数寄存器的值后,会依据后果设置不同的条件码。而这里还有另外两种指令,它们只设置条件码,而不扭转任何其余寄存器的值。如下图:

①、CMP 指令,指令模式 CMP S2,S1。而后会依据 S1-S2 的差来设置条件码。除了只设置条件码而不更新指标寄存器外,CMP 指令和 SUB 指令的行为是一样的。比方两个操作数相等,那么之差为 0,那么就会将零标记设置为 1;其余的标记也能够用来确定两个数的大小关系。

②、TEST 指令,和 AND 指令一样,除了 TEST 指令只设置条件码而不扭转目标寄存器的值。比方对于如下指令:

MOV AL,40H

TESTB AL,08H

下面的指令就是用来测试 AL 寄存器的左起第四位是否为 0,后果就是 0100 0000(40H)& 0000 1000(08H),测试后果左起第 4 位是 0,所以各个标记位:CF=0,OF=0,SF=0,ZF=1

3、拜访条件码
对于一般寄存器来讲,应用的时候个别是间接读取它的值,而对于条件码,通常不会间接读取。罕用的有如下三种办法:

①、能够依据条件码寄存器的某个组合,将一个字节设置为 0 或 1。

②、能够间接条件跳转到程序的某个其它的局部。

③、能够有条件的传送数据。

对于第一种状况,下图形容的指令便是依据条件码的某个组合,将一个字节设置为 0 或 1,这一整类指令称为 SET 指令,它们的区别就在与它们思考的条件码的组合是什么,这些指令名字的不同后缀指明了它们所思考的条件码的组合。

留神:这些指令的后缀示意不同的条件而不是操作数的大小。比方指令 setl 和 setb 示意“小于时设置(set less)”和“低于时设置(set below)”,而不是“设置长字(set long word)”和“设置字节(set byte)”。

上图所说的同义名,比如说 setg(示意“设置大于”)和 setnle(示意“不小于等于”)指的就是同一条机器指令,编译器和反编译器会随便决定应用哪个名字。

还有 set 指令中的目标操作数,只能是后面咱们所讲的 8 个单字节的寄存器或者是存储一个字节的存储器地位。

上面咱们别离对 set 指令呈现的后缀做简略介绍:

①、e->ZF(相等):equals 的意思,这里代表的组合是 ZF,因为 ZF 在后果为 0 时设为 1。因而 ZF 代表的意义是相等。

②、ne->ZF(不相等):not equals 的意思,这里代表的组合是 ZF,也就是 ZF 做“非运算”,则很显著是不相等的意思。

③、s->SF(正数):这里代表的组合是 SF,因为 SF 在计算结果为正数时设为 1,此时能够认为 b 为 0,即 a<0。因而这里是正数的意思。

④、ns->~SF(非正数):与 s 相同,加上 n 则是 not 的意思,因而这里代表非正数。

⑤、l->SF^OF(有符号的小于):l 代表的是 less。这里的组合是 SF^OF,即对 SF 和 OF 做“异或运算”。“异或运算”的意思则是代表,SF 和 OF 不能相等。那么有两种状况,当 OF 为 0 时,则代表没有溢出,此时 SF 必须为 1,SF 为 1 则代表后果为负。即 a-b<0,也就是 a<b,也就是小于的意思。当 OF 为 1 时,则代表产生了溢出,而此时 SF 必须为 0,也就是说后果最初为负数,那么此时则是负溢出,也能够失去 a-b<0,即 a<b。综合后面两种状况,SF^OF 则代表小于的意思。

⑥、le->(SF^OF)|ZF(有符号的小于等于):le 是 less equals 的意思。有了后面小于的根底,这里就很容易了解了。SF^OF 代表小于,ZF 代表等于,因而两者的“或运算”则代表小于等于。

⑦、g->(SF^OF)&ZF(有符号的大于):g 是 greater 的意思。这里的组合是 (SF^OF)&ZF,相对来说就比较复杂了。不过有了后面的铺垫,这个也十分好了解。SF^OF 代表小于,则 (SF^OF) 代表大于等于,而 ZF 代表不等于,将~(SF^OF) 与~ZF 取“与运算”,则代表大于等于且不等于,也就是大于。

⑧、ge->~(SF^OF)(有符号的大于等于):ge 是 greater equals 的意思。

⑨、b->CF(无符号的小于):b 是 below 的意思。CF 是无符号溢出标记,这里的意思是指如果 a-b 后果溢出了,则代表 a 是小于 b 的,即 a<b。其实这个论断很显然,关键点就在于,无符号减法只有在减出正数的时候才可能溢出,也就是说只有后果溢出了,那么肯定有 a-b<0。因而这个论断就不言而喻了。

⑩、be->CF|ZF(无符号的小于等于):这里是 below equals 的意思。因而这里会与 ZF 计算“或运算”,字面上也很容易了解,即 CF(小于)|(或)ZF(等于),也就是小于等于。

⑪、a->~CF&ZF(无符号的大于):a 代表的是 above。这个组合也是十分好了解的,CF 代表小于,则 CF 代表大于等于,ZF 代表不等于,因而 CF&~ZF 则代表大于等于且不等于,即大于。

⑫、ae->~CF(无符号的大于等于):ae 是 above equals 的意思。

比方对于 setae % al 指令来说,% al 是 % eax 寄存器中的最初一个字节,这个指令的含意是,将~CF 的值设置到 % eax 寄存器的最初一个字节。

4、跳转指令 jump
失常状况下,指令会依照他们呈现的程序一条一条地执行。而跳转指令(jump)会导致执行切换到程序中一个全新的地位,咱们能够了解为办法或者函数的调用。在汇编代码中,这些跳转的目的地通常用一个标号(label)指明。比方如下代码:

movl $0,%eax
    jmpl  .L1
    movl (%eax),%edx
.L1:
    popl %edx
复制代码 

指令 jmpl .L1 会导致程序跳过 movl 指令,从 popl 开始执行。在产生指标代码文件时,汇编器会确定所有带标号指令的地址,并将跳转指标(目标指令的地址)编码为跳转指令的一部分。

如下图所示,jump 指令有三种跳转形式:

①间接跳转:跳转指标是作为指令的一部分编码的,比方下面的间接给一个标号作为跳转指标

②间接跳转:跳转指标是从寄存器或者存储器地位中读出的,比方 jmp % eax 示意用寄存器 % eax 中的值作为跳转指标;再比方 jmp (% eax) 以 % eax 中的值作为读地址,从存储器中读取跳转指标。

③其余条件跳转:依据条件码的某个组合,或者跳转,或者继续执行代码序列中的下一条指令。

比方对于如下代码:文件名为 hello.c

int exchange(int x,int y)
{if(x < y){return y-x;}else{return x-y;}
}
复制代码 

咱们执行如下命令,将 C 程序 hello.c 变为汇编程序 hello.s

`gcc -O0 -S hello.c

复制代码 `
-O0 是优化选项,还有 O0 –>> O1 –>> O2 –>> O3,别离是从没有优化到优化级别最高。

置信看了后面几篇博客的相干指令介绍,这个汇编代码不难理解。x,y 别离寄存于栈顶地址偏移量为 – 4 和 – 8 的地位,而后比拟 x-y 的值,也就是指令 cmpl -8 (% rbp),% eax,如果 x 大于或等于 y, 那么跳转到 .L2 的地位,而后计算 subl % eax,% ecx 的值,即 x-y。

咱们还能够通过如下命令生成指标文件 hello.c

gcc -O0 -c hello.c
而后通过如下命令查看反汇编代码

objdump -d hello.o

5、循环
C 语言提供了多种循环构造,比方 do-while、while 和 for。汇编中没有相应的指令存在,咱们能够用条件测试和跳转指令组合起来实现循环的成果。而大多数汇编器会依据一个循环的 do-while 循环模式来产生循环代码,即其余的循环个别也会先转换成 do-while 模式,而后在编译成机器代码。

比方如下 do-while 循环:

下面的汇编代码就不做过多的介绍了,应该很容易看明确。

6、条件传送指令 cmov
条件传送指令。顾名思义,条件传送指令的意思就是在满足条件的时候进行传送的指令,也就是 cmov 指令。它与 set 指令十分相似,同样有 12 种,也就是加上 12 种条件码寄存器的组合即可,如下所示:

条件传送指令相当于一个 if/else 的赋值判断,个别状况下,条件传送指令的性能高于 if/else 的赋值判断。然而因为条件传送指令将对两个表达式都求值,因而如果两个表达式计算量很大时,那么条件传送指令的性能就可能不如 if/else 的分支判断了。不过总的来说,这种状况还是很少的,因而条件传送指令还是很有用的,只是并不是所有的处理器都反对条件传送指令,这依赖于处理器以及编译器的编译形式。

条件传送指令最大的毛病便是可能引起意料之外的谬误,比方对于上面这一段代码。

int cread(int *xp){return (xp ? *xp : 0);
}
复制代码 

咋一看,这一段代码是没问题的,不过如果应用条件传送指令去实现这段代码的话,将可能引起空指针援用的谬误。因为条件传送指令会先对两个表达式进行计算,也就是说无论 xp 是否有值,都将计算 * xp 这个表达式,因而当 xp 为空指针 0 时,则会产生谬误。由此可见,条件传送指令也不是哪都能用的,通常状况下,编译器会帮咱们尽力解决这种谬误。

正文完
 0