C指针原理(1)-ATT汇编
匯編在LINUX系統(tǒng)下的意義遠(yuǎn)遠(yuǎn)大于WINDOWS系統(tǒng),LINUX內(nèi)核部分代碼就是匯編編寫的。然后,絕大多數(shù) Linux 程序員以前只接觸過DOS/Windows 下的匯編語言,這些匯編代碼都是 Intel 風(fēng)格的。但在 Unix 和 Linux 系統(tǒng)中,更多采用的還是 AT&T 格式,兩者在語法格式上有著很大的不同,因此應(yīng)對AT&T匯編應(yīng)有一個(gè)基本的了解和熟悉。
我們在LINUX下用C編寫一段最簡單的helloworld程序,命令為hello.c
#include <stdio.h>int main() { printf("hello,world\n");exit(0); }然后,使用GCC編譯,同時(shí)使用-s參數(shù)生成中間匯編代碼,看看AT&T匯編的真實(shí)面目
.section .data#初始化的變量 output:.ascii "hello,world\n"#要打印的字符串,.data為初始化值的變量。output是標(biāo)簽,指示字符串開始的位置,ascii為數(shù)據(jù)類型 .section .bss#未初始化的變量,由0填充的緩沖區(qū).lcomm num,20#lcomm為本地內(nèi)存區(qū)域,即本地匯編外的不能進(jìn)行訪問。.comm是通用內(nèi)存區(qū)域。 .section .text#匯編語言指令碼.globl _start#啟動入口_start:movl $4,%eax#調(diào)用的系統(tǒng)功能,4為write movl $output,%ecx#要打印的字符串movl $1,%ebx#文件描述符,屏幕為1 movl $12,%edx#字符串長度int $0x80#顯示字符串hello,worldmovl $0,%eaxmovl $num,%edimovl $65,1(%edi)#A 的asciimovl $66,2(%edi)#B 的ascii movl $67,3(%edi)#C 的ascii movl $68,4(%edi)#D 的asciimovl $10,5(%edi)#\n的ascii movl $4,%eax#調(diào)用的系統(tǒng)功能,4為write movl $num,%ecx#要打印的字符串 movl $1,%ebx#文件描述符,屏幕為1 movl $6,%edx#字符串長度int $0x80#顯示字符串ABCDmovl $1,%eax#1為退出movl $0,%ebx#返回給shell的退出代碼值int $0x80#內(nèi)核軟中斷,退出系統(tǒng)gcc -S hello.c.file "hello.c".section .rodata.LC0:.string "hello,world".text.globl main.type main, @functionmain:pushl %ebpmovl %esp, %ebpandl $-16, %espsubl $16, %espmovl $.LC0, (%esp)call putsmovl $0, (%esp)call exit.size main, .-main.ident "GCC: (Ubuntu 4.4.3-4ubuntu5) 4.4.3".section .note.GNU-stack,"",@progbits匯編器(assembler)的作用是將用匯編語言編寫的源程序轉(zhuǎn)換成二進(jìn)制形式的目標(biāo)代碼。Linux 平臺的標(biāo)準(zhǔn)匯編器是 GAS,它是 GCC 所依賴的后臺匯編工具,通常包含在 binutils 軟件包中。
AT&T匯編主要有以下特點(diǎn):
1、在 AT&T 匯編格式中,寄存器名要加上 ‘%’ 作為前綴。
如:
把eax寄存器的內(nèi)容復(fù)制到ebx中
movl %eax,%ebx
2、用 ‘$’ 前綴表示一個(gè)立即操作數(shù)。
如:將1復(fù)制到eax中
movl $1, %eax
3、目標(biāo)操作數(shù)在源操作數(shù)的右邊
movl %eax,%ebx
eax是源操作數(shù),ebx是目標(biāo)操作數(shù)
4、在 AT&T 匯編格式中,操作數(shù)的字長由操作符的最后一個(gè)字母決定,后綴’b’、‘w’、'l’分別表示操作數(shù)為字節(jié)(byte,8 比特)、字(word,16 比特)和長字(long,32比特)
比如:
movl對32位進(jìn)行操作,將eax寄存器32位的內(nèi)容復(fù)制到ebx中
movl %eax, %ebxmovw對16位進(jìn)行操作,將ax寄存器的內(nèi)容復(fù)制到bx中movw %ax, %bxmovb對8位進(jìn)行操作,將al寄存器的內(nèi)容復(fù)制到bl中movb %al, %bl我們再以入棧為例:
pushl %ecx # 32位ecx的內(nèi)容入棧pushw %cx # 16位ecx的內(nèi)容入棧pushl $180 # 80做為一個(gè)32位整數(shù)入棧pushl data # data變量內(nèi)容入棧,長度為32位pushl $data # 這一個(gè)操作很特別,在變量前面加上$表示取變量的地址,這是將data變量的地址入棧5、在 AT&T 匯編格式中,絕對轉(zhuǎn)移和調(diào)用指(jump/call)的操作數(shù)前要加上’*'作為前綴
6、遠(yuǎn)程轉(zhuǎn)移指令和遠(yuǎn)程子調(diào)用指令的操作碼,在 AT&T 匯編格式中為 ljump和lcall
我們從生成的中間代碼可以看出這幾個(gè)特點(diǎn)。
我們再來看一段用AT&T匯編編寫的helloworld程序。
.section .data#初始化的變量 output:.ascii "hello,world\n"#要打印的字符串,.data為初始化值的變量。output是標(biāo)簽,指示字符串開始的位置,ascii為數(shù)據(jù)類型 .section .bss#未初始化的變量,由0填充的緩沖區(qū).lcomm num,20#lcomm為本地內(nèi)存區(qū)域,即本地匯編外的不能進(jìn)行訪問。.comm是通用內(nèi)存區(qū)域。 .section .text#匯編語言指令碼.globl _start#啟動入口_start:movl $4,%eax#調(diào)用的系統(tǒng)功能,4為write movl $output,%ecx#要打印的字符串movl $1,%ebx#文件描述符,屏幕為1 movl $12,%edx#字符串長度int $0x80#顯示字符串hello,worldmovl $0,%eaxmovl $num,%edimovl $65,1(%edi)#A 的asciimovl $66,2(%edi)#B 的ascii movl $67,3(%edi)#C 的ascii movl $68,4(%edi)#D 的asciimovl $10,5(%edi)#\n的ascii movl $4,%eax#調(diào)用的系統(tǒng)功能,4為write movl $num,%ecx#要打印的字符串 movl $1,%ebx#文件描述符,屏幕為1 movl $6,%edx#字符串長度int $0x80#顯示字符串ABCDmovl $1,%eax#1為退出movl $0,%ebx#返回給shell的退出代碼值int $0x80#內(nèi)核軟中斷,退出系統(tǒng)我們對上面這段匯編代碼的結(jié)構(gòu)和內(nèi)容進(jìn)行解說:
1、.section .data段存放著初始化的變量, .section .bss段存放著未初始化的變量
2、變量的定義采用以下格式:
變量名:
變量類型 變量值
上面代碼中的output變量就是這么定義的
下面例子定義了多個(gè)變量
.section .data msg: .ascii “This is a text” x: .double 109.45, 2.33, 19.16 y: .int 89 z: .int 21, 85, 27.equ a 8其中,msg為字符符,x為雙精度符點(diǎn)數(shù),y和z為整數(shù),a是一個(gè)特別的定義,它的是一個(gè)靜態(tài)變量的定義,使用.equ 變量名 變量值來實(shí)現(xiàn)
3、.section .bss段中變量訪問區(qū)域的定義規(guī)則為:
lcomm為本地內(nèi)存區(qū)域,即本地匯編外的不能進(jìn)行訪問,而.comm是通用內(nèi)存區(qū)域
比如上面的定義
.lcomm num,20
num為本地內(nèi)存區(qū)域。
4、section .text段為匯編語言指令碼,使用.globl _start指示_start標(biāo)記后的代碼為程序啟動入口。
5、#表示注釋,上面代碼的其它部分均有注釋,有匯編基礎(chǔ)的程序員應(yīng)很容易理解
變量的類型有以下幾種:
.ascii 文本字符串
.asciz 以NULL結(jié)束的文本字符串
.byte 字節(jié)值
.double 雙精度符點(diǎn)數(shù)
.float 單精度符點(diǎn)數(shù)
.int 32位整數(shù)
.long 32位整數(shù)
.octa 16位整數(shù)
.quad 8位整數(shù)
.short 16位整數(shù)
.single 單精度符點(diǎn)數(shù)
此外,AT&T匯編經(jīng)常會涉及字節(jié)順序反轉(zhuǎn),比較加載,交換,壓入彈出所有寄存器等操作,以下例子涉及了這些操作,
每行代碼都有詳細(xì)的注釋。
.bss段定義的數(shù)據(jù)元素為未初始化的變量,在運(yùn)行時(shí)對其進(jìn)行初始化。
可分為數(shù)據(jù)通用內(nèi)存區(qū)域和本地通用內(nèi)存區(qū)域
本地通用內(nèi)存區(qū)域不能從本地匯編代碼之外進(jìn)行訪問。
.text段存放代碼
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的C指针原理(1)-ATT汇编的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux下利用nohup后台运行jar
- 下一篇: etl报表开发是什么意思_中间表是什么?