gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解
例子:由多個源文件組成的C程序,經過編輯、預處理、編譯、鏈接等階段才能生成最終的可執行程序。此過程中,在__c__階段可以發現被調用的函數未定義。
A.?編輯和預處理 B. 預處理 C.?編譯 D. 鏈接
gcc/g++等編譯器 編譯原理: 預處理,編譯,匯編,鏈接各步驟詳解概述
C和C++編譯器是集成的,編譯一般分為四個步驟:
gcc
認為預處理的文件是(.i)是C文件,并且設定C形式的連接;
g++
認為預處理的文件是(.i)是C++文件,并且設定C++形式的連接;
?
源文件后綴名的一些含義和后續的操作:
- .c C源程序 預處理,編譯,匯編
- .C C++源程序 ? 預處理,編譯,匯編
- .cc ? C++源程序
- .cxx ?C++源程序 ? 預處理,編譯,匯編
- .m ?Objective-C源程序 預處理,編譯,匯編
- .i 預處理后的C文件 編譯,匯編
- .ii 預處理后的C++文件 編譯,匯編
- .s 匯編語言源程序 匯編
- .S 匯編語言源程序 預處理,匯編
- .h 預處理器文件 通常不出現在命令行上
其他后綴名的文件被傳遞給連接器(linker).通常包括:
.o 目標文件(Object file)
.a 歸檔庫文件(Archive file)
?
轉載請注明出處:?http://blog.csdn.net/elfprincexu
二、具體介紹一下GCC編譯步驟
首先,有以下hello.c源代碼
[cpp]?view plain?copy
(1)預處理階段
在該階段,編譯器將上述代碼中的stdio.h編譯進來,并且用戶可以使用Gcc的選項”-E”進行查看,該選項的作用是讓Gcc在預處理結束后停止編譯過程。預處理階段主要處理#include和#define,它把#include包含進來的.h 文件插入到#include所在的位置,把源程序中使用到的用#define定義的宏用實際的字符串代替,我們可以用-E選項要求gcc只進行預處理而不進行后面的三個階段,
?注意 :?Gcc指令的一般格式為:Gcc [選項] 要編譯的文件 [選項] [目標文件]
?其中,目標文件可缺省,Gcc默認生成可執行的文件,命為:編譯文件.out
?
[root@localhost Gcc]# Gcc –E hello.c –o hello.i
?
在此處,選項"-o"是指目標文件,".i"文件為已經過預處理的C原始程序。以下列出了hello.i文件的部分內容:
[cpp]?view plain?copy
由此可見,Gcc確實進行了預處理,它把”stdio.h”的內容插入到hello.i文件中。
?
(2)編譯階段
接下來進行的是編譯階段,在這個階段中,Gcc首先要檢查代碼的規范性、是否有語法錯誤等,以確定代碼的實際要做的工作,在檢查無誤后,Gcc把代碼翻譯成匯編語言。用戶可以使用”-S”選項來進行查看,該選項只進行編譯而不進行匯編,生成匯編代碼。
編譯階段是最重要的階段,在這個階段GCC首先檢查語法然后把由上步生成的*.i編譯成*.s文件。我們可以用如下命令告訴gcc進行這一步處理,gcc -S hello.i -o hello.s,-S選項告訴gcc把hello.i編譯成.s文件;
上面這兩步的輸出文件都是文本文件,我們可以用諸如cat的文本處理等命令閱讀這些輸出文件。 這個階段可以接收.c和.i類型的文件
[root@localhost Gcc]# Gcc –S hello.i –o hello.s
以下列出了hello.s的內容,可見Gcc已經將其轉化為匯編了,感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。
[cpp]?view plain?copy
(3)匯編階段
匯編階段把*.s文件翻譯成二進制機器指令文件*.o,如命令gcc -c hello.s -o hello.o,其中-c告訴gcc進行匯編處理。這步生成的文件是二進制文件,直接用文本工具打開看到的將是亂碼,我們需要反匯編工具如GDB的幫助才能讀懂它; 這個階段接收.c, .i, .s的文件都沒有問題。比如gcc -c hello.i -o hello.o等
匯編階段是把編譯階段生成的”.s”文件轉成目標文件,讀者在此可使用選項”-c”就可看到匯編代碼已轉化為”.o”的二進制目標代碼了。如下所示:?
[root@localhost Gcc]# Gcc –c hello.s –o hello.o
?
(4)鏈接階段
在成功編譯之后,就進入了鏈接階段。在這里涉及到一個重要的概念:函數庫。
讀者可以重新查看這個小程序,在這個程序中并沒有定義”printf”的函數實現,且在預編譯中包含進的”stdio.h”中也只有該函數的聲明,而沒有定義函數的實現,那么,是在哪里實現”printf”函數的呢?最后的答案是:系統把這些函數實現都被做到名為libc.so.6的庫文件中去了,在沒有特別指定時,Gcc會到系統默認的搜索路徑”/usr/lib”下進行查找,也就是鏈接到libc.so.6庫函數中去,這樣就能實現函數”printf”了,而這也就是鏈接的作用。
函數庫一般分為靜態庫和動態庫兩種。
- 靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其后綴名一般為”.a”。
- 動態庫與之相反,在編譯鏈接時并沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般后綴名為”.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。
[cpp]?view plain?copy
效果是一樣的。 用的時候和上面的靜態庫的用法一樣 但是到了運行程序的時候,需要指定動態庫的位置,可以環境變量來指定 export LD_LIBRARY_PATH=path,否則會提示找不到動態庫的位置
由于鏈接動態庫和靜態庫的時候使用的方法是一樣的,所以如果在庫中有同名的靜態庫文件和動態庫文件,比如libtest.a和libtest.so,根據gcc鏈接時默認優先選擇動態庫,會鏈接libtest.so,如果想要讓gcc選擇鏈接libtest.a那么需要指定一個選項,就是-static,這樣就會強制gcc找靜態庫文件了。
靜態庫鏈接時搜索路徑順序:
- 1. ld會去找GCC命令中的參數-L
- 2. 再找gcc的環境變量LIBRARY_PATH
- 3. 再找內定目錄 /lib /usr/lib /usr/local/lib 這是當初compile gcc時寫在程序內的
動態鏈接時、執行時搜索路徑順序:
- 1. 編譯目標代碼時指定的動態庫搜索路徑
- 2. 環境變量LD_LIBRARY_PATH指定的動態庫搜索路徑
- 3. 配置文件/etc/ld.so.conf中指定的動態庫搜索路徑
- 4. 默認的動態庫搜索路徑/lib
- 5. 默認的動態庫搜索路徑/usr/lib
有關環境變量:
- LIBRARY_PATH環境變量:指定程序靜態鏈接庫文件搜索路徑
- LD_LIBRARY_PATH環境變量:指定程序動態鏈接庫文件搜索路徑
完成了鏈接之后,Gcc就可以生成可執行文件,如下所示。
[root@localhost Gcc]# Gcc hello.o –o hello
?
運行該可執行文件,出現正確的結果如下。?
[root@localhost Gcc]# ./hello
Hello! This is our embedded world!
總結
以上是生活随笔為你收集整理的gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C/C++笔试、面试题
- 下一篇: 设计模式总结: 5种创建型,7种结构型,