强制生成32位arm程序_3. 从0开始学ARM-ARM模式、寄存器、流水线
關(guān)于ARM的一些基本概念,大家可以參考我之前的文章:
到底什么是Cortex、ARMv8、arm架構(gòu)、ARM指令集、soc?一文幫你梳理基礎(chǔ)概念【科普】
一口網(wǎng)Linux:嵌入式工程師到底要不要學(xué)習(xí)ARM匯編指令?
一口網(wǎng)Linux:1. 從0開始學(xué)ARM-安裝Keil MDK uVision集成開發(fā)環(huán)境
一口網(wǎng)Linux:2. 從0開始學(xué)ARM-CPU原理,基于ARM的SOC講解
有了計(jì)算機(jī)硬件架構(gòu)的原理,下面我就可以學(xué)習(xí)ARM模式、寄存器、流水線等基礎(chǔ)知識。
一、ARM技術(shù)特征
ARM的成功,一方面得益于它獨(dú)特的公司運(yùn)作模式,另一方面,當(dāng)然來自于ARM處理器自身的優(yōu)良性能。作為一種先進(jìn)的RISC處理器,ARM處理器有如下特點(diǎn)。
二、ARM的基本數(shù)據(jù)類型
ARM采用的是32位架構(gòu),ARM的基本數(shù)據(jù)類型有以下3種。
注意:
三、ARM處理器工作模式
Cortex系列之前的ARM處理器工作模式一共有7種。
1. 工作模式
Cortex系列的ARM處理器工作模式有8種,多了1個monitor模式,如下圖所示:
ARM之所以設(shè)計(jì)出這么多種模式出來,就是為了「應(yīng)對CPU在運(yùn)行時各種突發(fā)事件」,比如要支持正常的應(yīng)用程序的運(yùn)行,在運(yùn)行任何一個時間點(diǎn)又可能發(fā)生很多異常事件,比如:關(guān)機(jī)、收到網(wǎng)卡信息、除數(shù)為0、訪問非法內(nèi)存、解析到了非法指令等等,不光要能處理這些異常還要能夠從異常中再返回到原來的程序繼續(xù)執(zhí)行。
除用戶模式以外,其余的所有6種模式稱之為非用戶模式,或特權(quán)模式(Privileged Modes);其中除去用戶模式和系統(tǒng)模式以外的5種又稱為異常模式(ExceptionModes),常用于處理中斷或異常,以及需要訪問受保護(hù)的系統(tǒng)資源等情況。
2. 模式切換
ARM微處理器的運(yùn)行模式可以通過軟件改變,也可以通過外部中斷或異常處理改變。應(yīng)用程序運(yùn)行在用戶模式下,當(dāng)處理器運(yùn)行在用戶模式下時,某些被保護(hù)的系統(tǒng)資源是不能被訪問的。
3. 異常(Exception)
指由處理器執(zhí)行指令導(dǎo)致原來運(yùn)行程序的中止,異常與指令運(yùn)行相關(guān),是CPU執(zhí)行程序產(chǎn)生的,是同步的,可分為精確異常和非精確異常。異常處理遵守嚴(yán)格的程序順序,不能嵌套,只有當(dāng)?shù)谝粋€異常處理完并返回后才能處理后續(xù)的異常。
4. 異常源
要進(jìn)入異常模式,一定要有異常源,ARM規(guī)定有7種異常源:
5. 異常源與模式關(guān)系
異常發(fā)生之后,CPU必須要立刻做出響應(yīng),關(guān)于異常后面會詳細(xì)講解。
四、ARM寄存器
Cortex A系列ARM處理器共有40個32位寄存器,其中33個為通用寄存器,7個為狀態(tài)寄存器。usr模式和sys模式共用同一組寄存器。
通用寄存器包括R0~R15,可以分為3類:
1. 未分組寄存器R0~R7
在所有運(yùn)行模式下,未分組寄存器都指向同一個物理寄存器,它們未被系統(tǒng)用作特殊的用途.因此在中斷或異常處理進(jìn)行運(yùn)行模式轉(zhuǎn)換時,由于不同的處理器運(yùn)行模式均使用相同的物理寄存器,所以可能造成寄存器中數(shù)據(jù)的破壞。
2. 分組寄存器R8~R14
對于分組寄存器,它們每一次所訪問的物理寄存器都與當(dāng)前處理器的運(yùn)行模式有關(guān)。
對于R8~R12來說,每個寄存器對應(yīng)2個不同的物理寄存器,當(dāng)使用FIQ(快速中斷模式)時,訪問寄存器 R8_fiq~R12_fiq;當(dāng)使用除FIQ模式以外的其他模式時,訪問寄存器R8_usr~R12_usr。
對于R13,R14來說,每個寄存器對應(yīng)7個不同的物理寄存器,其中一個是用戶模式與系統(tǒng)模式共用,另外6個物理寄存器對應(yīng)其他6種不同的運(yùn)行模式,并采用以下記號來區(qū)分不同的物理寄存器:
R13_mode R14_mode其中mode可為:「usr,fiq,irq,svc,abt,und,mon」。
3. 寄存器R13(sp)
在ARM指令中常用作「堆棧指針」,用戶也可使用其他的寄存器作為堆棧指針,而在Thumb指令集中,某些指令強(qiáng)制性的要求使用R13作為堆棧指針。
寄存器R13在ARM指令中常用作堆棧指針,但這只是一種習(xí)慣用法,用戶也可使用其他的寄存器作為堆棧指針。而在Thumb指令集中,某些指令強(qiáng)制性的要求使用R13作為堆棧指針。
由于處理器的每種運(yùn)行模式均有自己獨(dú)立的物理寄存器R13,在用戶應(yīng)用程序的初始化部分,一般都要初始化每種模式下的R13,使其指向該運(yùn)行模式的棧空間。這樣,當(dāng)程序的運(yùn)行進(jìn)入異常模式時,可以將需要保護(hù)的寄存器放入R13所指向的堆棧,而當(dāng)程序從異常模式返回時,則從對應(yīng)的堆棧中恢復(fù),采用這種方式可以保證異常發(fā)生后程序的正常執(zhí)行。
4. R14(LR)鏈接寄存器(Link Register)
當(dāng)執(zhí)行子程序調(diào)用指令(BL)時,R14可得到R15(程序計(jì)數(shù)器PC)的備份。
在每一種運(yùn)行模式下,都可用R14保存子程序的返回地址,當(dāng)用BL或BLX指令調(diào)用子程序時,將PC的當(dāng)前值復(fù)制給R14,執(zhí)行完子程序后,又將R14的值復(fù)制回PC,即可完成子程序的調(diào)用返回。以上的描述可用指令完成。
從子程序返回:
「方法1:」
MOV PC, LR 或者BX LR「方法2:」 在子程序入口處使用以下指令將R14存入堆棧:
STMFD SP!,{,LR}對應(yīng)的,使用以下指令可以完成子程序返回:
LDMFD SP!,{,PC}5. R15(PC)程序狀態(tài)寄存器
寄存器R15用作程序計(jì)數(shù)器(PC),在ARM狀態(tài)下,位[1:0]為0,位[31:2]用于保存PC,在Thumb狀態(tài)下,位[0]為0,位[31:1]用于保存PC。
比如如果pc的值是0x40008001,那么在尋址的時候其實(shí)會查找地址0x40008000,低2位會自動忽略掉。「個中原因,請讀者自己思考?」
由于ARM體系結(jié)構(gòu)采用了多級流水線技術(shù),對于ARM指令集而言,PC總是指向當(dāng)前指令的下兩條指令的地址,即PC的值為當(dāng)前指令的地址值加8個字節(jié)。
即:PC值=當(dāng)前程序執(zhí)行位置+8【流水線技術(shù)參考第七章】
6. CPSR、SPSR
「CPSR」(Current Program Status Register,當(dāng)前程序狀態(tài)寄存器),CPSR可在任何運(yùn)行模式下被訪問,它包括條件標(biāo)志位、中斷禁止位、當(dāng)前處理器模式標(biāo)志位,以及其他一些相關(guān)的控制和狀態(tài)位。
每一種運(yùn)行模式下又都有一個專用的物理狀態(tài)寄存器,稱為「SPSR」(Saved Program Status Register,備份的程序狀態(tài)寄存器),當(dāng)異常發(fā)生時,SPSR用于保存CPSR的當(dāng)前值,從異常退出時則可由SPSR來恢復(fù)CPSR。
由于用戶模式和系統(tǒng)模式不屬于異常模式,它們沒有SPSR,當(dāng)在這兩種模式下訪問SPSR,結(jié)果是未知的。
寄存器CPSR格式如下:
「N (Number)」: 當(dāng)用兩個補(bǔ)碼表示的帶符號數(shù)進(jìn)行運(yùn)算時,N=1表示運(yùn)行結(jié)果為負(fù),N=0表示運(yùn)行結(jié)果為正或零
「Z :(Zero)」: Z=1表示運(yùn)算結(jié)果為零,Z=0表示運(yùn)行結(jié)果非零
「C」 : 可以有4種方法設(shè)置C的值:
- (Come)加法運(yùn)算(包括CMP):當(dāng)運(yùn)算結(jié)果產(chǎn)生了進(jìn)位時C=1,否則C=0
- 減法運(yùn)算(包括CMP):當(dāng)運(yùn)算產(chǎn)生了借位,C=0否則C=1
- 對于包含移位操作的非加/減運(yùn)算指令 ,C為移出值的最后一位
- 對于其他的非加/減運(yùn)算指令C的值通常不改變
「V」 :
(oVerflow)對于加/減法運(yùn)算指令,當(dāng)操作數(shù)和運(yùn)算結(jié)果為二進(jìn)制的補(bǔ)碼表示的帶符號位溢出時,V=1表示符號位溢出;對于其他的非加/減運(yùn)算指令V的值通常不改變
「Q」: 在ARM V5及以上版本的E系列處理器中,用Q標(biāo)志位指示增強(qiáng)的DSP運(yùn)算指令是否發(fā)生了溢出。在其它版本的處理器中,Q標(biāo)志位無定義
「J:」
僅ARM v5TE-J架構(gòu)支持 , T=0;J = 1 處理器處于Jazelle狀態(tài),也可以和其他位組合.
「E位:」 大小端控制位
「A位:」 A=1 禁止不精確的數(shù)據(jù)異常
「T :」 T = 0;J=0; 處理器處于 ARM 狀態(tài) T = 1;J=0 處理器處于 Thumb 狀態(tài) T = 1;J=1 處理器處于 ThumbEE 狀態(tài)
「中斷禁止位I,F」【重要】 I=1 禁止IRQ中斷 F=1 禁止FIQ中斷
比如我們要想在程序中實(shí)現(xiàn)禁止中斷,那么就需要將CPSR[7]置1。
注意觀察這5個bit的特點(diǎn),最高位都是1,低4位的值則各不相同,這個很重要,要想搞清楚uboot、linux的源碼,尤其是異常操作的代碼,必須要知道這幾個bit的值。
五、協(xié)處理器
ARM體系結(jié)構(gòu)允許通過增加協(xié)處理器來擴(kuò)展指令集。最常用的協(xié)處理器是用于控制片上功能的系統(tǒng)協(xié)處理器。
例如,控制Cache和存儲管理單元MMU的CP15協(xié)處理器、設(shè)置異常向量表地址的mcr指令。
ARM支持16個協(xié)處理器,在程序執(zhí)行過程中,每個協(xié)處理器忽略屬于ARM處理器和其他協(xié)處理器指令,當(dāng)一個協(xié)處理器硬件不能執(zhí)行屬于她的協(xié)處理器指令時,就會產(chǎn)生一個未定義的異常中斷,在異常中斷處理程序中,可以通過軟件模擬該硬件的操作,比如,如果系統(tǒng)不包含向量浮點(diǎn)運(yùn)算器,則可以選擇浮點(diǎn)運(yùn)算軟件模擬包來支持向量浮點(diǎn)運(yùn)算。
ARM協(xié)處理器指令包括如下三類:
這些指令包括如下5條:
關(guān)于協(xié)處理器指令,我們只需要知道幾個常用的即可,后面文章會提到。
六、Jazelle
Jazelle杰則來 或者說Java字節(jié)碼狀態(tài)是為了運(yùn)行Java虛擬機(jī)而添加的一種狀態(tài)。
ARM的Jazelle技術(shù)在硬件上提供了對Java字節(jié)碼的支持,大大提高了系統(tǒng)的性能。
由于ARM 架構(gòu)是32-bits,16-bits = “halfword” , “word” = 32-bits。
Java 字節(jié)碼 8-bits 獨(dú)立架構(gòu)的指令集。Jazelle 用硬件執(zhí)行大多數(shù)的字節(jié)碼(另一些使用高度優(yōu)化了的ARM 代碼)。這是由于折衷了硬件復(fù)雜度(功耗 & 硅片面積)和速度。
七、指令流水線
流水線技術(shù)通過多個功能部件并行工作來縮短程序執(zhí)行時間,提高處理器核的效率和吞吐率,從而成為微處理器設(shè)計(jì)中最為重要的技術(shù)之一。
1. 3級流水線
到ARM7為止的ARM處理器使用簡單的3級流水線,它包括下列流水線級。 (1)取指令 從寄存器裝載一條指令。 (2)譯碼(decode) 識別被執(zhí)行的指令,并為下一個周期準(zhǔn)備數(shù)據(jù)通路的控制信號。在這一級,指令占有譯碼邏輯,不占用數(shù)據(jù)通路。 (3)執(zhí)行 處理指令并將結(jié)果寫回寄存器。
當(dāng)處理器執(zhí)行簡單的數(shù)據(jù)處理指令時,流水線使得平均每個時鐘周期能完成1條指令。但一條指令需要3個時鐘周期來完成,因此有3個時鐘周期的延時,但吞吐率是每個周期一條指令。
對于3級流水線,PC寄存器里的值并不是正在執(zhí)行的指令的地址,而是預(yù)取指令的地址,這個知識點(diǎn)很重要,后面我們會詳細(xì)的舉例來證明。
處理器要滿足高性能的要求,為了滿足這個要求,需要重新考慮處理器的組織結(jié)構(gòu)。 提高性能的方法主要有兩種方法:
較高性能的ARM核使用了5級流水線,而且具有分開的指令和數(shù)據(jù)存儲器。 在Cortex-A8中有一條13級的流水線,但是ARM公司沒有對其中的技術(shù)公開任何相關(guān)的細(xì)節(jié)。
從經(jīng)典ARM系列到現(xiàn)在Cortex系列,ARM處理器的結(jié)構(gòu)在向復(fù)雜的階段發(fā)展,但沒改變的是CPU的取址指令和地址關(guān)系,「不管是幾級流水線,都可以按照最初的3級流水線的操作特性來判斷其當(dāng)前的PC位置」。
2. 流水線舉例
為方便理解,下面我們以3級流水線為例,
1)最佳流水線
這是一個理想的實(shí)例,所有的指令都在寄存器中執(zhí)行,且處理器完全不必離開芯片本身。每個周期,都有一條指令被執(zhí)行,流水線的容量得到了充分的發(fā)揮。 指令周期數(shù) (CPI) = 1
2)LDR流水線
該例中,用6周期執(zhí)行了4條指令 指令周期數(shù) (CPI) = 1.5
與最佳流水線不同,裝載(LDR) 操作將數(shù)據(jù)移進(jìn)片內(nèi)導(dǎo)致了指令/數(shù)據(jù)總線被占用,因此隨后緊跟了內(nèi)部的寫周期( writeback)以完成將數(shù)據(jù)寫回寄存器。
3)分支流水線
BL指令用于實(shí)現(xiàn)指令流的跳轉(zhuǎn),并存儲返回地址到寄存器R14(LR)中。
4)中斷流水線
「IRQ 中斷的反應(yīng)時間最小=7周期」
這將恢復(fù)工作模式并從響應(yīng)中斷前的下一條指令處取指,如果有多個中斷,需堆棧保存返回地址。 注意最大的FIQ響應(yīng)延遲為 29個周期(而非Thumb狀態(tài)的28周期!)。
嵌入式學(xué)習(xí)交流,請關(guān)注 一口Linux
總結(jié)
以上是生活随笔為你收集整理的强制生成32位arm程序_3. 从0开始学ARM-ARM模式、寄存器、流水线的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python使用ddt_python使用
- 下一篇: postgresql 客户端_Postg