當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

压栈，跳转，执行，返回：从汇编看函数调用

發(fā)布時(shí)間：2024/7/23 编程问答 58 豆豆

生活随笔收集整理的這篇文章主要介紹了压栈，跳转，执行，返回：从汇编看函数调用小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

From：https://www.jianshu.com/p/594357dff57e

C函數(shù)調(diào)用過(guò)程原理及函數(shù)棧幀分析：https://blog.csdn.net/zsy2020314/article/details/9429707

從本篇開(kāi)始，我們討論一些高級(jí)語(yǔ)言中的基礎(chǔ)設(shè)施：堆棧，函數(shù)調(diào)用，變量生命周期等等話(huà)題。因?yàn)檫@里本身會(huì)涉及到比較多的匯編層面的基礎(chǔ)概念。為了向大家說(shuō)明匯編層的函數(shù)調(diào)用實(shí)現(xiàn)細(xì)節(jié)，無(wú)奈我只能羅列出很多匯編上的概念，因?yàn)楸疚募俣ㄗx者不需要具有任何匯編知識(shí)。我討厭長(zhǎng)篇大論，但本篇的解釋可能仍然不夠明晰。在此為自己知識(shí)的淺薄表示歉意。

1. 從代碼的順序執(zhí)行說(shuō)起

每一個(gè)程序員腦子里應(yīng)該都有這么一種印象：“程序是順序執(zhí)行的”。這個(gè)觀(guān)點(diǎn)其實(shí)和我們開(kāi)篇所講的cpu的流水線(xiàn)執(zhí)行過(guò)程直接相關(guān)。
讓我們?cè)倩貞浺幌履X海中關(guān)于函數(shù)調(diào)用的概念，也許會(huì)是這個(gè)樣子：

這里的“控制流轉(zhuǎn)移”又是如何發(fā)生的呢？在解釋這個(gè)之前，也許我們需要科普一點(diǎn)有關(guān)于匯編的知識(shí)。

2. 函數(shù)調(diào)用中的一些細(xì)節(jié)說(shuō)明

2.1 函數(shù)調(diào)用中的關(guān)鍵寄存器

2.1.1 程序計(jì)數(shù)器PC

程序計(jì)數(shù)器是一個(gè)計(jì)算機(jī)組成原理中講過(guò)的概念，下面給出一個(gè)百度百科中的簡(jiǎn)單解釋

程序計(jì)數(shù)器是用于存放下一條指令所在單元的地址的地方。
當(dāng)執(zhí)行一條指令時(shí)，首先需要根據(jù)PC中存放的指令地址，將指令由內(nèi)存取到指令寄存器中，此過(guò)程稱(chēng)為“取指令”。與此同時(shí)，PC中的地址或自動(dòng)加1或由轉(zhuǎn)移指針給出下一條指令的地址。此后經(jīng)過(guò)分析指令，執(zhí)行指令。完成第一條指令的執(zhí)行，而后根據(jù)PC取出第二條指令的地址，如此循環(huán)，執(zhí)行每一條指令。

可以看到，程序計(jì)數(shù)器是一個(gè)cpu執(zhí)行指令代碼過(guò)程中的關(guān)鍵寄存器：它指向了當(dāng)前計(jì)算機(jī)要執(zhí)行的指令地址，CPU總是從程序計(jì)數(shù)器取出當(dāng)前指令來(lái)執(zhí)行。當(dāng)指令執(zhí)行后，程序計(jì)數(shù)器的值自動(dòng)增加，指向下一條將要執(zhí)行的指令。

在x86匯編中，執(zhí)行程序計(jì)數(shù)器功能的寄存器被叫做EIP，也叫作指令指針寄存器。

2.1.2 基址指針，棧指針和程序棧

棧是程序設(shè)計(jì)中的一種經(jīng)典數(shù)據(jù)結(jié)構(gòu)，每個(gè)程序都擁有自己的程序棧。很重要的一點(diǎn)是，棧是向下生長(zhǎng)的。所謂向下生長(zhǎng)是指從內(nèi)存高地址->低地址的路徑延伸，那么就很明顯了，棧有棧底和棧頂，那么棧頂?shù)牡刂芬葪５椎汀?duì)x86體系的CPU而言，其中
---> 寄存器ebp（base pointer ）可稱(chēng)為“幀指針”或“基址指針”，其實(shí)語(yǔ)意是相同的。
---> 寄存器esp（stack pointer）可稱(chēng)為“ 棧指針”。
在C和C++語(yǔ)言中，臨時(shí)變量分配在棧中，臨時(shí)變量擁有函數(shù)級(jí)的生命周期，即“在當(dāng)前函數(shù)中有效，在函數(shù)外無(wú)效”。這種現(xiàn)象就是函數(shù)調(diào)用過(guò)程中的參數(shù)壓棧，堆棧平衡所帶來(lái)的。對(duì)于這種實(shí)現(xiàn)的細(xì)節(jié)，我們會(huì)在接下來(lái)的環(huán)節(jié)中詳細(xì)討論。

2.2. 堆棧平衡

堆棧平衡這個(gè)概念指的是函數(shù)調(diào)完成后，要返還所有使用過(guò)的棧空間。這種說(shuō)法可能有點(diǎn)抽象，我們可以舉一個(gè)簡(jiǎn)單的例子來(lái)類(lèi)比：
我們都知道函數(shù)的臨時(shí)變量存放在棧中。那我們來(lái)看下面的代碼，它是一個(gè)很簡(jiǎn)單的函數(shù),用來(lái)交換傳入的2個(gè)參數(shù)的值：

void __stdcall swap(int& a,int& b) {int c = a;a = b;b = c; }

我們可以看到，在這個(gè)函數(shù)中使用了一個(gè)臨時(shí)變量int c;這個(gè)變量分配在棧中，我們可以簡(jiǎn)單的理解為，在聲明臨時(shí)變量c后，我們就向當(dāng)前的程序棧中壓入了一個(gè)int值：

int c = a; <==> push(a); //簡(jiǎn)單粗暴，臨時(shí)變量的聲明理解為簡(jiǎn)單地向棧中push一個(gè)值。

那現(xiàn)在這個(gè)函數(shù)swap調(diào)用結(jié)束了，我們是否需要退棧，把之前臨時(shí)變量c使用的棧空間返還回去？需要嗎？不需要嗎？
我們假設(shè)不需要，當(dāng)我們頻繁調(diào)用swap的時(shí)候，會(huì)發(fā)生什么？每次調(diào)用，程序棧都在生長(zhǎng)。直到棧滿(mǎn)，我們就會(huì)收到stack overflow錯(cuò)誤，程序掛掉了。
所以為了避免這種烏龍的事情發(fā)生，我們需要在函數(shù)調(diào)用結(jié)束后，退棧，把堆棧還原到函數(shù)調(diào)用前的狀態(tài)，這些被pop掉的臨時(shí)變量，自然也就失效了，這也解釋了我們一直以來(lái)關(guān)于臨時(shí)變量?jī)H在當(dāng)前函數(shù)內(nèi)有效的認(rèn)知。其實(shí)堆棧平衡這個(gè)概念本身比這種粗淺的理解要復(fù)雜的多，還應(yīng)包括壓棧參數(shù)的平衡，暫時(shí)我們可以簡(jiǎn)單地這樣理解，后面再做詳細(xì)說(shuō)明。

2.3. 函數(shù)的參數(shù)傳遞和調(diào)用約定

函數(shù)的參數(shù)傳遞是一個(gè)參數(shù)壓棧的過(guò)程。函數(shù)的所有參數(shù)，都會(huì)依次被push到棧中。那調(diào)用約定有是什么呢？
C和C++程序員應(yīng)該對(duì)所謂的調(diào)用約定有一定的印象，就像下面這種代碼：

void __stdcall add(int a,int b);

函數(shù)聲明中的__stdcall就是關(guān)于調(diào)用約定的聲明。其中標(biāo)準(zhǔn)C函數(shù)的默認(rèn)調(diào)用約定是__stdcall,C++全局函數(shù)和靜態(tài)成員函數(shù)的默認(rèn)調(diào)用約定是__cdecl，類(lèi)的成員函數(shù)的調(diào)用約定是__thiscall。剩下的還有__fastcall，__naked等。

為什么要用所謂的調(diào)用約定？調(diào)用約定其實(shí)是一種約定方式，它指明了函數(shù)調(diào)用中的參數(shù)傳遞方式和堆棧平衡方式。

2.3.1 參數(shù)傳遞方式

還是之前那個(gè)例子，swap函數(shù)有2個(gè)參數(shù)，int a,int b。這兩個(gè)參數(shù)，入棧的順序誰(shuí)先誰(shuí)后？
其實(shí)是從左到右入棧還是從右到左入棧都可以，只要函數(shù)調(diào)用者和函數(shù)內(nèi)部使用相同的順序存取參數(shù)即可。在上述的所有調(diào)用約定中，參數(shù)總是從右到左壓棧，也就是最后一個(gè)參數(shù)先入棧。我們可以使用一份偽代碼描述這個(gè)過(guò)程

push b; //先壓入?yún)?shù)b push a; //再壓入?yún)?shù)a call swap; //調(diào)用swap函數(shù)

其實(shí)從這里我們就可以理解為什么在函數(shù)內(nèi)部，不能改變函數(shù)外部參數(shù)的值：因?yàn)楹瘮?shù)內(nèi)部訪(fǎng)問(wèn)到的參數(shù)其實(shí)是壓入棧的變量值，對(duì)它的修改只是修改了棧中的"副本"。指針和引用參數(shù)才能真正地改變外部變量的值。

2.3.2 堆棧平衡方式

因?yàn)楹瘮?shù)調(diào)用過(guò)程中，參數(shù)需要壓棧，所以在函數(shù)調(diào)用結(jié)束后，用于函數(shù)調(diào)用的壓棧參數(shù)也需要退棧。那這個(gè)工作是交給調(diào)用者完成，還是在函數(shù)內(nèi)部自己完成？其實(shí)兩種都可以。調(diào)用者負(fù)責(zé)平衡堆棧的主要好處是可以實(shí)現(xiàn)可變參數(shù)（關(guān)于可變參數(shù)的話(huà)題，在此不做過(guò)多討論。如果可能的話(huà)，我們可以以一篇單獨(dú)的文章來(lái)講這個(gè)問(wèn)題），因?yàn)樵趨?shù)可變的情況下，只有調(diào)用者才知道具體的壓棧參數(shù)有幾個(gè)。
下面列出了常見(jiàn)調(diào)用約定的堆棧平衡方式：

調(diào)用約定堆棧平衡方式

__stdcall	函數(shù)自己平衡
__cdecl	調(diào)用者負(fù)責(zé)平衡
__thiscall	調(diào)用者負(fù)責(zé)平衡
__fastcall	調(diào)用者負(fù)責(zé)平衡
__naked	編譯器不負(fù)責(zé)平衡，由編寫(xiě)者自己負(fù)責(zé)

2.4. 棧幀的概念：從esp和ebp說(shuō)起

為什么我們需要ebp和esp2個(gè)寄存器來(lái)訪(fǎng)問(wèn)棧？這種觀(guān)念其實(shí)來(lái)自于函數(shù)的層級(jí)調(diào)用：函數(shù)A調(diào)用函數(shù)B，函數(shù)B調(diào)用函數(shù)C，函數(shù)C調(diào)用函數(shù)D...
這種調(diào)用可能會(huì)涉及非常多的層次。編譯器需要保證在這種復(fù)雜的嵌套調(diào)用中，能夠正確地處理每個(gè)函數(shù)調(diào)用的堆棧平衡。所以我們引入了2個(gè)寄存器：

1. ebp指向了本次函數(shù)調(diào)用開(kāi)始時(shí)的棧頂指針，它也是本次函數(shù)調(diào)用時(shí)的“棧底”（這里的意思是，在一次函數(shù)調(diào)用中，ebp向下是函數(shù)的臨時(shí)變量使用的空間）。在函數(shù)調(diào)用開(kāi)始時(shí)，我們會(huì)使用?mov ebp,esp 把當(dāng)前的esp保存在ebp中。
2.?esp，它指向當(dāng)前的棧頂，它是動(dòng)態(tài)變化的，隨著我們申請(qǐng)更多的臨時(shí)變量，esp值不斷減小（正如前文所說(shuō)，棧是向下生長(zhǎng)的）。
3.?函數(shù)調(diào)用結(jié)束，我們使用?mov esp,ebp?來(lái)還原之前保存的esp。

在函數(shù)調(diào)用過(guò)程中，ebp和esp之間的空間被稱(chēng)為本次函數(shù)調(diào)用的“棧幀”。函數(shù)調(diào)用結(jié)束后，處于棧幀之前的所有內(nèi)容都是本次函數(shù)調(diào)用過(guò)程中分配的臨時(shí)變量，都需要被“返還”。這樣在概念上，給了函數(shù)調(diào)用一個(gè)更明顯的分界。下圖是一個(gè)程序運(yùn)行的某一時(shí)刻的棧幀圖：

3. 匯編中關(guān)于“函數(shù)調(diào)用”的實(shí)現(xiàn)

上面鋪陳了很多的匯編層面的概念后，我們終于可以切回到我們本次的主題：函數(shù)調(diào)用。
函數(shù)調(diào)用其實(shí)可以看做4個(gè)過(guò)程，也就是本篇標(biāo)題：

壓棧: 函數(shù)參數(shù)壓棧，返回地址壓棧

跳轉(zhuǎn): 跳轉(zhuǎn)到函數(shù)所在代碼處執(zhí)行

執(zhí)行: 執(zhí)行函數(shù)代碼

返回: 平衡堆棧，找出之前的返回地址，跳轉(zhuǎn)回之前的調(diào)用點(diǎn)之后，完成函數(shù)調(diào)用

1. call指令壓棧和跳轉(zhuǎn)

下面我們看一下函數(shù)調(diào)用指令

0x210000 call swap; 0x210005 mov ecx,eax;

我們可以把它理解為2個(gè)指令：

push 0x210005; jmp swap;

也就是，首先把call指令的下一條指令地址作為本次函數(shù)調(diào)用的返回地址壓棧，然后使用jmp指令修改指令指針寄存器EIP，使cpu執(zhí)行swap函數(shù)的指令代碼。

2. ret指令返回

匯編中有ret相關(guān)的指令，它表示取出當(dāng)前棧頂值，作為返回地址，并將指令指針寄存器EIP修改為該值，實(shí)現(xiàn)函數(shù)返回。
下面給出一組示意圖來(lái)演示函數(shù)的返回過(guò)程：

1. 當(dāng)前EIP的值為0x210004，指向指令ret 4，程序需要返回

2. 執(zhí)行ret指令，將當(dāng)前esp指向的堆棧值當(dāng)做返回地址，設(shè)置eip跳轉(zhuǎn)到此處并彈出該值

經(jīng)過(guò)這兩步，函數(shù)就返回到了調(diào)用處。

4. 從實(shí)際匯編代碼看函數(shù)調(diào)用

4.1 程序源碼和運(yùn)行結(jié)果

源碼：

main.cpp#include <stdio.h>void __stdcall swap(int& a, int& b);int main(int argc, char* argv) {int a = 1, b = 2;printf("before swap: a = %d, b = %d\r\n", a, b);swap(a, b);printf("after swap: a = %d, b = %d\r\n", a, b); }void __stdcall swap(int& a, int& b) {int c = a;a = b;b = c; }

程序運(yùn)行結(jié)果：

4.2 反匯編

可以看到，在函數(shù)調(diào)用前，函數(shù)參數(shù)已被壓棧，此時(shí):
EBP = 00AFFCAC
ESP = 00AFFBBC
EIP = 00BF1853
我們按F11，進(jìn)入函數(shù)內(nèi)部，此時(shí)：

其實(shí)就是call swap指令的下一條指令地址，它就是本次函數(shù)調(diào)用的返回地址。

下面是一個(gè)swap函數(shù)的詳細(xì)注釋：

當(dāng)程序運(yùn)行到 ret 8時(shí)

執(zhí)行返回后：

在返回前，ESP = 00AFFBB8，返回后 ESP = 00AFFBC4
0x00AFFBC4 - 0x00AFFBB8 = 0xC
這里的數(shù)值是字節(jié)數(shù)，而我們知道，int是4字節(jié)長(zhǎng)度。所以0xC/4 = 3
正好是2個(gè)壓棧參數(shù)+一個(gè)返回地址。

4.3 調(diào)用堆棧

調(diào)試程序的時(shí)候，我們經(jīng)常關(guān)注的一個(gè)點(diǎn)就是VisualStudio顯示給我們的“調(diào)用堆棧”功能，這次讓我們來(lái)仔細(xì)看一下它：
我們重新執(zhí)行一次程序，這次我們關(guān)注一下vs顯示的調(diào)用堆棧，如下圖

第一行是當(dāng)前指令地址
第二行是外層調(diào)用者，我們雙擊它，跳轉(zhuǎn)到如下地址：

也許這也是為什么這個(gè)功能被叫做“調(diào)用堆棧”的原因：它正是通過(guò)對(duì)程序棧的分析實(shí)現(xiàn)的。

總結(jié)

以上是生活随笔為你收集整理的压栈，跳转，执行，返回：从汇编看函数调用的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：转载：使用 frida hook 插件化
下一篇： Learn X in Y minutes