在 x86 的计算机系统中,内存空间中的栈主要用于保存函数的参数,返回值,返回地址,本地变量等。一切的函数调用都要将不同的数据、地址压入或者弹出栈。
什么是栈?
栈是一种 LIFO(后进先出)
可以想象下函数调用的时候, 父函数调用子函数,父函数在前,子函数在后。返回的时候子函数先返回,父函数后返回。 ps: 递归就是明显利用函数调用这种栈的结构来实现的。
什么是栈帧?
栈帧本质上是一种栈,只是这种栈专门用于保存函数调用过程中的各种信息(参数,返回地址,本地变量等)。栈帧有栈顶和栈底之分,其中栈顶的地址最低,栈底的地址最高。
两个主要寄存器
1. ESP 寄存器
栈指针寄存器 (extended stack pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的栈顶。
2.EBP 寄存器
基址指针寄存器(extended base pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的底部。

一般来说,我们将 %ebp 到 %esp 之间区域当做栈帧(也有人认为该从函数参数开始,不过这不影响分析)。并不是整个栈空间只有一个栈帧,每调用一个函数,就会生成一个新的栈帧。在函数调用过程中,我们将调用函数的函数称为 “调用者(caller)”,将被调用的函数称为“被调用者(callee)”。在这个过程中,1)“调用者” 需要知道在哪里获取 “被调用者” 返回的值;2)“被调用者”需要知道传入的参数在哪里,3)返回的地址在哪里。同时,我们需要保证在 “被调用者” 返回后,%ebp, %esp 等寄存器的值应该和调用前一致。因此,我们需要使用栈来保存这些数据。
函数调用实例
函数的调用
//被调函数 calleeint CalleeFunction(int x, int y, int z){int a, b, c;a = 4;b = 5;c = 6;return;}//主调函数 callerint CallerFunction(){int x = 1, y = 2, z = 3;//调用被调函数CalleeFunction(1, 2, 3);...}
我们来看下 Callee 函数的汇编代码
_CalleeFunction:push %ebp ; //保存%ebp的值movl %esp, $ebp ; //将%esp的值赋给%ebp,使新的%ebp指向栈顶movl -12(%esp), %esp ; //分配额外空间给本地变量movl $4, -4(%ebp) ;movl $5, -8(%ebp) ;movl $6, -12(%ebp) ;
此时调用者做了两件事情:第一,将被调用函数的参数按照从右到左的顺序压入栈中。第二,将返回地址压入栈中。这两件事都是调用者负责的,因此压入的栈应该属于调用者的栈帧。我们再来看看被调用者,它也做了两件事情:第一,将老的(调用者的) %ebp 压入栈,此时 %esp 指向它。第二,将 %esp 的值赋给 %ebp, %ebp 就有了新的值,它也指向存放老 %ebp 的栈空间。这时,它成了是函数 CalleeFunction() 栈帧的栈底。这样,我们就保存了 “调用者” 函数的 %ebp,并且建立了一个新的栈帧。

在 %ebp 更新后,我们先分配一块 0x12 字节的空间用于存放本地变量,这步一般都是用 sub 或者 mov 指令实现。在这里使用的是 movl。通过使用 mov 配合 -4(%ebp), -8(%ebp) 和 -12(%ebp) 我们便可以给 a, b 和 c 赋值了。

函数返回
和调用函数时正好相反。当函数完成自己的任务后,它会将 %esp 移到 %ebp 处,然后再弹出旧的 %ebp 的值到 %ebp。这样,%ebp 就恢复到了函数调用前的状态。
//被调函数 calleeint CalleeFunction(int x, int y, int z){int a, b, c;...return;}
汇编代码
_CalleeFunction:push %ebpmovl %esp, %ebpmovl -12(%esp), %esp...mov %ebp, %esppop %ebpret
ret 指令,这个指令相当于 pop + jum。它首先将数据(返回地址)弹出栈并保存到 %eip 中,然后处理器根据这个地址无条件地跳到相应位置获取新的指令。

被调用函数返回后的栈帧
小结
这批函数栈帧分析为基础 方便大家理解 golang 启动过程中对栈帧的一系列操作,比如最骚的把 goexit() 塞入到newg 的栈顶等过程~
https://zhuanlan.zhihu.com/p/425119402
