當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

7. 从0学ARM-GNU伪指令、代码编译，lds使用

發布時間：2023/12/15 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了 7. 从0学ARM-GNU伪指令、代码编译，lds使用小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

《嵌入式工程師到底要不要學習ARM匯編指令？arm學習文章匯總》

《到底什么是Cortex、ARMv8、arm架構、ARM指令集、soc？一文幫你梳理基礎概念【科普】》
關于ARM指令用到的IDE開發環境可以參考下面這篇文章
《1. 從0開始學ARM-安裝Keil MDK uVision集成開發環境》
《2. 從0開始學ARM-CPU原理，基于ARM的SOC講解》
《3. 從0開始學ARM-ARM模式、寄存器、流水線》
《4. 從0開始學ARM-ARM指令，移位、數據處理、BL、機器碼》
《5. 從0開始學ARM-MRS、MSR、尋址操作、原子操作原理》
《6. 從0開始學ARM-異常及中斷處理、異常向量表、swi》

八、GNU偽指令、代碼編譯，lds使用

一、MDK和GNU偽指令區別

我們在學習匯編代碼的時候經過會看到以下兩種風格的代碼：

gnu代碼開頭是：

.global _start _start: @匯編入口ldr sp,=0x41000000 .end @匯編程序結束

MDK代碼開頭是：

AREA Example,CODE,READONLY ;聲明代碼段ExampleENTRY ;程序入口 Start MOV R0,#0 OVEREND

這兩種風格的代碼是要使用不同的編譯器，我們之前的實例代碼都是MDK風格的。

那么多對于我們初學者來說要學習哪種風的呢？
答案是肯定的，學習GNU風格的匯編代碼，因為做Linux驅動開發必須掌握的linux內核、uboot，而這兩個軟件就是GNU風格的。

為了大家不要把過多精力浪費在暫時沒用的知識上，下面我們只講GNU風格匯編。

二、GNU匯編書寫格式：

1. 代碼行中的注釋符號:

‘@’ 整行注釋符號:
‘#’ 語句分離符號:
直接操作數前綴: ‘#’ 或 ‘$’

2. 全局標號：

標號只能由a～z，A～Z，0～9，“.”，_等（由點、字母、數字、下劃線等組成，除局部標號外，不能以數字開頭）字符組成，標號的后面加“：”。

段內標號的地址值在匯編時確定；段外標號的地址值在連接時確定。

3. 局部標號:

局部標號主要在局部范圍內使用而且局部標號可以重復出現。它由兩部組成開頭是一個0-99直接的數字局部標號后面加“:”

F：指示編譯器只向前搜索，代碼行數增加的方向 / 代碼的下一句 B：指示編譯器只向后搜索，代碼行數減小的方向

注意局部標號的跳轉，就近原則
舉例：

文件位置 arch/arm/kernel/entry-armv.S

三、偽操作：

1. 符號定義偽指令

標號含義

.global	使得符號對連接器可見，變為對整個工程可用的全局變量
_start	匯編程序的缺省入口是_ start標號,用戶也可以在連接腳本文件中用ENTRY標志指明其它入口點.
.local	表示符號對外部不可見，只對本文件可見

2. 數據定義（Data Definition）偽操作

數據定義偽操作一般用于為特定的數據分配存儲單元，同時可完成已分配存儲單元的初始化。
常見的數據定義偽操作有如下幾種：

標號含義

.byte	單字節定義 0x12,‘a’,23 【必須偶數個】
.short	定義2字節數據 0x1234,65535
.long /.word	定義4字節數據 0x12345678
.quad	定義8字節 .quad 0x1234567812345678
.float	定義浮點數 .float 0f3.2
.string/.asciz/.ascii	定義字符串 .ascii “abcd\0”, 注意：.ascii 偽操作定義的字符串需要每行添加結尾字符 ‘\0’，其他不需要
.space/.skip	用于分配一塊連續的存儲區域并初始化為指定的值，如果后面的填充值省略不寫則在后面填充為0;
.rept	重復執行接下來的指令，以.rept開始，以.endr結束

【舉例】

.word

val: .word 0x11223344 mov r1,#val ;將值0x11223344設置到寄存器r1中

.space

label: .space size,expr ;expr可以是4字節以內的浮點數 a: space 8, 0x1

.rept

.rept cnt ;cnt是重復次數.endr

注意：

變量的定義放在，stop后，.end前

標號是地址的助記符，標號不占存儲空間。位置在end前就可以，相對隨意。

3. if選擇

語法結構

.if logical-expressing …… .else…… .endif

類似c語言里的條件編譯。

【舉例】

.if val2==1mov r1,#val2 .endif

4. macro宏定義

.macro，.endm 宏定義類似c語言里的宏函數。

macro偽操作可以將一段代碼定義為一個整體，稱為宏指令。然后就可以在程序中通過宏指令多次調用該段代碼。

語法格式：

.macro {$label} 名字{$parameter{,$parameter}…}……..code.endm

其中，$標號在宏指令被展開時，標號會被替換為用戶定義的符號。

宏操作可以使用一個或多個參數，當宏操作被展開時，這些參數被相應的值替換。

注意：先定義后使用

舉例：

【例1】：沒有參數的宏實現子函數返回

.macro MOV_PC_LRMOV PC,LR.endm 調用方式如下：MOV_PC_LR

【例2】：帶參數宏實現子函數返回

.macro MOV_PC_LR ,parammov r1,\paramMOV PC,LR.endm

調用方法如下:

MOV_PC_LR #12

四、雜項偽操作

標號含義

.global/	用來聲明一個全局的符號
.arm	定義一下代碼使用ARM指令集編譯
.thumb	定義一下代碼使用Thumb指令集編譯
.section	.section expr 定義一個段。expr可以使.text .data. .bss
.text	.text {subsection} 將定義符開始的代碼編譯到代碼段
.data	.data {subsection} 將定義符開始的代碼編譯到數據段,初始化數據段
.bss	.bss {subsection} 將變量存放到.bss段,未初始化數據段
.align	.align{alignment}{,fill}{,max} 通過用零或指定的數據進行填充來使當前位置與指定邊界對齊
	.align 4 — 16字節對齊 2的4次方
	.align (4) — 4字節對齊
.org	.org offset{,expr} 指定從當前地址加上offset開始存放代碼，并且從當前地址到當前地址加上offset之間的內存單元，用零或指定的數據進行填充
.extern	用于聲明一個外部符號，用于兼容性其他匯編
.code 32	同.arm
.code 16	同.thumb
.weak	用于聲明一個弱符號，如果這個符號沒有定義，編譯就忽略，而不會報錯
.end	文件結束
.include	.include “filename” 包含指定的頭文件, 可以把一個匯編常量定義放在頭文件中
.equ	格式：.equ symbol, expression把某一個符號(symbol)定義成某一個值(expression).該指令并不分配空間，類似于c語言的 #define
.set	給一個全局變量或局部變量賦值，和.equ的功能一樣

舉例：
.set

.set start, 0x40 mov r1, #start ;r1里面是0x40

舉例
.equ

.equ start, 0x40 mov r1, #start ;r1里面是0x40 #define PI 3.1415

等價于

.equ PI, 31415

五、GNU偽指令

關鍵點：偽指令在編譯時會轉化為對應的ARM指令

ADR偽指令：
該指令把標簽所在的地址加載到寄存器中。
ADR偽指令為小范圍地址讀取偽指令，使用的相對偏移范圍：當地址值是字節對齊 (8位) 時，取值范圍為-255～255，當地址值是字對齊 (32位) 時，取值范圍為-1020～1020。
語法格式:

ADR{cond} register,labelADR R0, lable

ADRL偽指令：
將中等范圍地址讀取到寄存器中

ADRL偽指令為中等范圍地址讀取偽指令。使用相對偏移范圍：當地址值是字節對齊時，取值范圍為-64～64KB；當地址值是字對齊時，取值范圍為-256～256KB

語法格式：

ADRL{cond} register,label ADRL R0，lable

LDR偽指令:
LDR偽指令裝載一個32位的常數和一個地址到寄存器。
語法格式：

LDR{cond} register,=[expr|label-expr] LDR R0，=0XFFFF0000 ； mov r1,#0x12 對比一下

注意：
（1）ldr偽指令和ldr指令區分
下面是ldr偽指令：

ldr r1,=val @ r1 = val 是偽指令，將val標號地址賦給r1 【與MDK不一樣，MDK只支持ldr r1,=val】

下面是ldr指令：

ldr r2,val @ r1 = *val 是arm指令,將標號val地址里的內容給r2 val: .word 0x11223344

（2）如何利用ldr偽指令實現長跳轉

ldr pc，=32位地址

（3）編碼中解決非立即數的問題
用arm偽指令ldr

ldr r0,=0x999 ；0x999 不是立即數，

六、GNU匯編的編譯

1. 不含lds文件的編譯

假設我們有以下代碼，包括1個main.c文件，1個start.s文件：
start.s

.global _start _start: @匯編入口ldr sp,=0x41000000b main .global mystrcopy .text mystrcopy: //參數dest->r0,src->r2LDRB r2, [r1], #1STRB r2, [r0], #1CMP r2, #0 //判斷是不是字符串尾BNE mystrcopyMOV pc, lr stop:b stop @死循環，防止跑飛等價于while(1) .end @匯編程序結束

main.c

extern void mystrcopy(char *d,const char *s); int main(void) {const char *src ="yikoulinux";char dest[20]={};mystrcopy(dest,src);//調用匯編實現的mystrcopy函數while(1);return 0; }

Makefile編寫方法如下：

1. TARGET=start 2. TARGETC=main 3. all: 4. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGETC).o $(TARGETC).c 5. arm-none-linux-gnueabi-gcc -O0 -g -c -o $(TARGET).o $(TARGET).s 6. #arm-none-linux-gnueabi-gcc -O0 -g -S -o $(TARGETC).s $(TARGETC).c 7. arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Ttext 0x40008000 -o $(TARGET).elf 8. arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin 9. clean: 10. rm -rf *.o *.elf *.dis *.bin

Makefile含義如下：

定義環境變量TARGET=start，start為匯編文件的文件名

定義環境變量TARGETC=main，main為c語言文件

目標：all，4~8行是該指令的指令語句

將main.c編譯生成main.o,$(TARGETC)會被替換成main

將start.s編譯生成start.o,$(TARGET)會被替換成start

4-5也可以用該行1條指令實現

通過ld命令將main.o、start.o鏈接生成start.elf,-Ttext 0x40008000表示設置代碼段起始地址為0x40008000

通過objcopy將start.elf轉換成start.bin文件，-O binary (或–out-target=binary) 輸出為原始的二進制文件,-S (或 --strip-all)輸出文件中不要重定位信息和符號信息，縮小了文件尺寸，

clean目標

clean目標的執行語句，刪除編譯產生的臨時文件

【補充】

gcc的代碼優化級別，在 makefile 文件中的編譯命令
4級 O0 – O3 數字越大，優化程度越高。O3最大優化

volatile作用
volatile修飾的變量，編譯器不再進行優化，每次都真正訪問內存地址空間。

2. 依賴lds文件編譯

實際的工程文件，段復雜程度遠比我們這個要復雜的多，尤其Linux內核有幾萬個文件，段的分布及其復雜，所以這就需要我們借助lds文件來定義內存的分布。

main.c和start.s和上一節一致。

map.lds

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") /*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/ OUTPUT_ARCH(arm) ENTRY(_start) SECTIONS {. = 0x40008000;. = ALIGN(4);.text :{.start.o(.text)*(.text)}. = ALIGN(4);.rodata : { *(.rodata) }. = ALIGN(4);.data : { *(.data) }. = ALIGN(4);.bss :{ *(.bss) } }

解釋一下上述的例子:

OUTPUT_FORMAT(“elf32-littlearm”, “elf32-littlearm”, “elf32-littlearm”)
指定輸出object檔案預設的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式；

OUTPUT_ARCH(arm) 指定輸出的平臺為arm，可以透過objdump -i查詢支持平臺；

ENTRY(_start) ：將符號_start的值設置成入口地址；

. = 0x40008000: 把定位器符號置為0x40008000(若不指定, 則該符號的初始值為0)；

.text : { .start.o(.text) *(.text) } :前者表示將start.o放到text段的第一個位置，后者表示將所有(*符號代表任意輸入文件)輸入文件的.text section合并成一個.text section；

.rodata : { *(.data) } : 將所有輸入文件的.rodata section合并成一個.rodata section；

.data : { *(.data) } : 將所有輸入文件的.data section合并成一個.data section；

.bss : { *(.bss) } : 將所有輸入文件的.bss section合并成一個.bss section；該段通常存放全局未初始化變量

. = ALIGN(4);表示下面的段4字節對齊

連接器每讀完一個section描述后, 將定位器符號的值增加該section的大小。

來看下，Makefile應該如何寫：

# CORTEX-A9 PERI DRIVER CODE # VERSION 1.0 # ATHUOR 一口Linux # MODIFY DATE # 2020.11.17 Makefile #=================================================# CROSS_COMPILE = arm-none-linux-gnueabi- NAME =start CFLAGS=-mfloat-abi=softfp -mfpu=vfpv3 -mabi=apcs-gnu -fno-builtin -fno-builtin-function -g -O0 -c LD = $(CROSS_COMPILE)ld CC = $(CROSS_COMPILE)gcc OBJCOPY = $(CROSS_COMPILE)objcopy OBJDUMP = $(CROSS_COMPILE)objdump OBJS=start.o main.o #================================================# all: $(OBJS)$(LD) $(OBJS) -T map.lds -o $(NAME).elf$(OBJCOPY) -O binary $(NAME).elf $(NAME).bin $(OBJDUMP) -D $(NAME).elf > $(NAME).dis %.o: %.S $(CC) $(CFLAGS) -c -o $@ $< %.o: %.s $(CC) $(CFLAGS) -c -o $@ $< %.o: %.c$(CC) $(CFLAGS) -c -o $@ $< clean:rm -rf $(OBJS) *.elf *.bin *.dis *.o

編譯結果如下：

最終生成start.bin,改文件可以燒錄到開發板測試，因為本例沒有直觀現象，后續文章我們加入其它功能再測試。

【注意】

其中交叉編譯工具鏈arm-none-linux-gnueabi- 要根據自己實際的平臺來選擇，本例是基于三星的exynos-4412工具鏈實現的。

地址0x40008000也不是隨便選擇的，
讀者可以根據自己手里的開發板對應的soc手冊查找該地址。

1）linux內核的異常向量表

linux內核的內存分布也是依賴lds文件定義的，linux內核的編譯我們暫不討論，編譯好之后會再以下位置生成對應的lds文件:

arch/arm/kernel/vmlinux.lds

我們看下該文件的部分內容：

OUTPUT_ARCH(arm)制定對應的處理器；

ENTRY(stext)表示程序的入口是stext。

同時我們也可以看到linux內存的劃分更加的復雜，后續我們討論linux內核，再繼續分析該文件。

3. elf文件和bin文件區別：

1） ELF

ELF文件格式是一個開放標準，各種UNIX系統的可執行文件都采用ELF格式，它有三種不同的類型：

可重定位的目標文件（Relocatable，或者Object File）
可執行文件（Executable）
共享庫（Shared Object，或者Shared Library）

ELF格式提供了兩種不同的視角，鏈接器把ELF文件看成是Section的集合，而加載器把ELF文件看成是Segment的集合。

2） bin

BIN文件是直接的二進制文件，內部沒有地址標記。bin文件內部數據按照代碼段或者數據段的物理空間地址來排列。一般用編程器燒寫時從00開始，而如果下載運行，則下載到編譯時的地址即可。

在Linux OS上，為了運行可執行文件，他們是遵循ELF格式的，通常gcc -o test test.c，生成的test文件就是ELF格式的，這樣就可以運行了，執行elf文件，則內核會使用加載器來解析elf文件并執行。

在Embedded中，如果上電開始運行，沒有OS系統，如果將ELF格式的文件燒寫進去，包含一些ELF文件的符號表字符表之類的section，運行碰到這些，就會導致失敗，如果用objcopy生成純粹的二進制文件，去除掉符號表之類的section，只將代碼段數據段保留下來，程序就可以一步一步運行。

elf文件里面包含了符號表等。BIN文件是將elf文件中的代碼段，數據段，還有一些自定義的段抽取出來做成的一個內存的鏡像。

并且elf文件中代碼段數據段的位置并不是它實際的物理位置。他實際物理位置是在表中標記出來的。

更多嵌入式Linux干貨，請關注【一口Linux】

總結

以上是生活随笔為你收集整理的7. 从0学ARM-GNU伪指令、代码编译，lds使用的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：企业网络组建项目实训--交换机的配置与管
下一篇：【中兴交换机MC-LAG配置】