Linux Dynamic Shared Library LD Linker
目錄
1. 動態(tài)鏈接的意義 2. 地址無關(guān)代碼: PIC 3. 延遲版定(PLT Procedure Linkage Table) 4. 動態(tài)鏈接相關(guān)結(jié)構(gòu) 5. 動態(tài)鏈接的步驟和實現(xiàn) 6. Linux動態(tài)鏈接器實現(xiàn) 7. 顯式運行時鏈接 8. 共享庫系統(tǒng)路徑 && 默認(rèn)加載順序?
1. 動態(tài)鏈接的意義
1. 靜態(tài)鏈接對內(nèi)存和磁盤的浪費很嚴(yán)重,在靜態(tài)鏈接中,C語言靜態(tài)庫是很典型的占用空間的例子 2. 靜態(tài)鏈接對程序的更新、部署、發(fā)布會造成嚴(yán)重的麻煩為了解決這些問題,最好的思路就是把程序的模塊相互分割開來,形成獨立的文件,而不再將它們靜態(tài)地鏈接在一起。簡單來說,就是不對那些組成程序的目標(biāo)文件進(jìn)行鏈接,等到程序要運行時才進(jìn)行鏈接,也就是說,把鏈接這個過程推遲到了運行時再進(jìn)行,這就是"動態(tài)鏈接(dynamic linking)"的基本思想
0x1: 動態(tài)鏈接的優(yōu)點
1. 多個進(jìn)程使用到同一個動態(tài)鏈接庫文件,只要在內(nèi)存中映射一份ELF .SO文件即可,有效地減少了進(jìn)程的內(nèi)存消耗2. 減少物理頁面的換入換出(減少page out、page in操作)3. 增加CPU緩存的命中率,因為不同進(jìn)程間的數(shù)據(jù)和指令訪問都集中在了同一個共享模塊上4. 使程序的升級更加容易,在升級程序庫或共享某個模塊時,只要簡單地將舊的目標(biāo)文件覆蓋掉,而無須將所有的程序再重新鏈接一遍。當(dāng)程序下一次運行的時候,新版本的目標(biāo)文件會被自動裝載到內(nèi)存并鏈接起來,程序就完成了升級的操作5. 程序可擴(kuò)展性和兼容性 使用動態(tài)鏈接技術(shù),程序在運行時可以動態(tài)地選擇加載各種程序模塊,即插件技術(shù)(Plug-in)1) 程序按照一定的規(guī)則制定好程序的接口,第三方開發(fā)者可以按照這種接口來編寫符合要求的動態(tài)鏈接文件,該程序可以動態(tài)地載入各種由第三方開發(fā)的模塊,在程序運行時動態(tài)地鏈接,實現(xiàn)程序功能的擴(kuò)展。典型地如php的zend擴(kuò)展、iis的filter/extension、apache的mod模塊2) 動態(tài)鏈接還可以加強(qiáng)程序的兼容性。一個程序在不同的平臺運行時可以動態(tài)地鏈接到由操作系統(tǒng)提供的動態(tài)鏈接庫,這些動態(tài)鏈接庫在程序和操作系統(tǒng)之間增加了一個中間層,從而消除了程序?qū)Σ煌脚_之間依賴的差異性0x2: 動態(tài)鏈接文件的類別
動態(tài)鏈接涉及運行時的鏈接及多個文件的裝載,必須要有操作系統(tǒng)的支持,因為動態(tài)鏈接的情況下,進(jìn)程的虛擬地址空間的分布會比靜態(tài)鏈接的情況下更為復(fù)雜,還需要考慮到一些存儲管理、內(nèi)存共享、進(jìn)程線程等機(jī)制的考慮
1. Linux 在Linux系統(tǒng)中,ELF動態(tài)鏈接文件被稱為動態(tài)共享對象(DSO Dynamic Shared Objects),一般以".so"為擴(kuò)展名 常用的C語言庫的運行庫glibc,它的動態(tài)鏈接形式的版本保存在"/lib/libc.so"、"/lib64/libc.so"。整個系統(tǒng)只保留一份C語言庫的動態(tài)鏈接文件,而所有的由C語言編寫的、動態(tài)鏈接的程序都可以在運行時使用它,當(dāng)程序被裝載時,系統(tǒng)的動態(tài)鏈接器會將程序所需的所有動態(tài)鏈接庫(最基本的就是libc.so)裝載到進(jìn)程的地址空間,并且將程序中所有未決議的符號綁定到相應(yīng)的動態(tài)鏈接庫中,并進(jìn)行重定位工作2. Windows 在Windows系統(tǒng)中,動態(tài)鏈接文件被稱為動態(tài)鏈接庫(Dynamic Linking Library),一般以".dll"為擴(kuò)展名Relevant Link:
?
2. 地址無關(guān)代碼: PIC
0x1: 裝載時重定位
Linux和GCC支持2種重定位的方法
1. 鏈接時重定位(Link Time Relocation) -shared -fPIC 在程序鏈接的時候就將代碼中對絕對地址的引用重定位為實際的地址2. 裝載時重定位(Load Time Relocation) -shared 程序模塊在編譯時目標(biāo)地址不確定而需要在裝載時將模塊重定位0x2: 地址無關(guān)代碼
裝載時重定位是解決動態(tài)模塊中有絕對地址引用的方法之一,但是還存在一個問題,指令部分無法在多個進(jìn)程間共享,為了解決這個問題,一個基本思想就是把指令中那些需要被修改的部分分離出來,跟數(shù)據(jù)部分放在一起,這樣指令就可以保持不變,而數(shù)據(jù)部分可以在每個進(jìn)程中擁有一個副本,這種方案就是地址無關(guān)代碼(PIC Position-Independent Code)
我們把共享對象模塊中的地址引用按照模塊內(nèi)部引用/模塊外部引用、指令引用/數(shù)據(jù)訪問分為4類
/* pic.c */ static int a; extern int b; extern void ext();void bar() {//Type2: Inner-module data access(模塊內(nèi)數(shù)據(jù)訪問)a = 1;//Tyep4: Inter-module data access(模塊間數(shù)據(jù)訪問)b = 2; }void foo() {//Type1: Inner-module call(模塊內(nèi)指令引用) bar();//Type3: Inter-module call() ext(); }值得注意的是,當(dāng)編譯器在編譯pic.c時,它并不能確定變量b、函數(shù)ext()是模塊外部還是模塊內(nèi)部的,因為它們有可能被定義在同一個共享對象的其他目標(biāo)文件中,所以編譯器只能把它們都當(dāng)作模塊外部的函數(shù)和變量來處理
Type1: Inner-module call(模塊內(nèi)指令引用)
這是最簡單的一種情況,被調(diào)用的函數(shù)與調(diào)用者都處于同一個模塊,它們之間的相對位置是固定的,對于現(xiàn)代操作系統(tǒng)來說,模塊內(nèi)部跳轉(zhuǎn)、函數(shù)調(diào)用都可以是"相對地址調(diào)用"、或者是"基于寄存器的相對調(diào)用",所以對于這種指令是不需要重定位的,只要模塊內(nèi)的相對位置不變,則模塊內(nèi)的指令調(diào)用就是地址無關(guān)的
Type2: Inner-module data access(模塊內(nèi)數(shù)據(jù)訪問)
我們知道,一個模塊前面一般是若干個頁的代碼,后面緊跟著若干個頁的數(shù)據(jù),這些頁之間的相對位置是固定的,所以只需要相對于當(dāng)前指令加上"固定的偏移量"就可以訪問到模塊內(nèi)部數(shù)據(jù)了
Type3: Inter-module call()
GOT實現(xiàn)指令地址無關(guān)的方式和GOT實現(xiàn)模塊間數(shù)據(jù)訪問的方式類似,唯一不同的是,GOT中的項保存的是目標(biāo)函數(shù)的地址,當(dāng)模塊要調(diào)用目標(biāo)函數(shù)時,可以通過GOT中的項進(jìn)行間接跳轉(zhuǎn)
Tyep4: Inter-module data access(模塊間數(shù)據(jù)訪問)
模塊間的數(shù)據(jù)訪問比模塊內(nèi)部稍微麻煩一點,因為模塊間的數(shù)據(jù)訪問目標(biāo)地址要等到裝載時才能確定。而我們要達(dá)到代碼地址無關(guān)的目的,最基本的思想就是把和地址相關(guān)的部分放到數(shù)據(jù)段中,ELF的做法是在數(shù)據(jù)段里建立一個指向這些變量的指針數(shù)組,也被稱為全局偏移表(global offset table GOT),當(dāng)代碼需要引用到該全局變量時,可以通過GOT中相對應(yīng)的項進(jìn)行間接引用。
鏈接器在裝載動態(tài)模塊的時候會查找每個變量所在的地址,然后填充GOT中的各個項,以確保每個指針?biāo)赶虻牡刂氛_,由于GOT本身是放在數(shù)據(jù)段的,所以它可以在模塊裝載時被修改,并且每個進(jìn)程都可以有獨立的副本,相互不受影響。
綜上所述,地址無關(guān)代碼的實現(xiàn)方式如下
使用GCC產(chǎn)生地址無關(guān)代碼很簡單,只需要使用"-fPIC"參數(shù)即可
區(qū)分一個DSO是否為PIC的方法很簡單,輸入以下指令
readelf -d hook.so | grep TEXTREL /* 1. PIC PIC的DSO是不會包含任何代碼段重定位表的,TEXTREL表示代碼段重定位表地址2. 非PIC 本條指令有任何輸出,則hook.so就不是PIC */地址無關(guān)代碼技術(shù)除了可以用在共享對象上面,它也可以用于可執(zhí)行文件,一個以地址無關(guān)方式編譯的可執(zhí)行文件被稱作地址無關(guān)可執(zhí)行文件(PIE Position-Independent Executable),與GCC的"-fPIC"類似,產(chǎn)生PIE的參數(shù)為"-fPIE"
0x3: PIC
ELF格式的共享庫使用"PIC技術(shù)"使代碼和數(shù)據(jù)的引用與地址無關(guān),程序可以被加載到地址空間的任意位置。PIC在代碼中的跳轉(zhuǎn)和分支指令不使用絕對地址。PIC在ELF可執(zhí)行映像的數(shù)據(jù)段中建立一個存放所有全局變量指針的全局偏移量表GOT
0X4:?全局偏移表(GOT)
1. 對于模塊外部引用的全局變量和全局函數(shù),用GOT表的表項內(nèi)容作為地址來間接尋址 2. 對于本模塊內(nèi)的靜態(tài)變量和靜態(tài)函數(shù),用GOT表的首地址作為一個基準(zhǔn),用相對于該基準(zhǔn)的偏移量來引用,因為不論程序被加載到何種地址空間,模塊內(nèi)的靜態(tài)變量和靜態(tài)函數(shù)與GOT的距離是固定的,并且在鏈接階段就可知曉其距離的大小這樣,PIC使用GOT來引用變量和函數(shù)的絕對地址,把位置獨立的引用重定向到真實的絕對位置,對于PIC代碼,代碼段內(nèi)不存在重定位項,實際的重定位項只是在數(shù)據(jù)段的GOT表內(nèi)。共享目標(biāo)文件中的重定位類型有
1. R_386_RELATIVE 2. R_386_GLOB_DAT 3. R_386_JMP_SLOT用于在動態(tài)鏈接器加載映射共享庫或者模塊運行的時候?qū)χ羔橆愋偷撵o態(tài)數(shù)據(jù)、全局變量符號地址和全局函數(shù)符號地址進(jìn)行重定位
0x5:?過程鏈接表(PLT)
過程鏈接表(PLT)用于把位置獨立的函數(shù)調(diào)用重定向到絕對位置。通過PLT動態(tài)鏈接的程序支持惰性綁定模式。每個動態(tài)鏈接的程序和共享庫都有一個PLT,PLT表的每一項都是一小段代碼,對應(yīng)于本運行模塊要引用的一個全局函數(shù)。程序?qū)δ硞€函數(shù)的訪問都被調(diào)整為對PLT入口的訪問,每個PLT入口項對應(yīng)一個GOT項,執(zhí)行函數(shù)實際上就是跳轉(zhuǎn)到相應(yīng)GOT項存儲的地址,該GOT項初始值為PLTn項中的push指令地址(即jmp的下一條指令,所以第1次跳轉(zhuǎn)沒有任何作用),待符號解析完成后存放符號的真正地址。動態(tài)鏈接器在裝載映射共享庫時在GOT里設(shè)置2個特殊值
1. GOT+4(即 GOT[1]): 設(shè)置動態(tài)庫映射信息數(shù)據(jù)結(jié)構(gòu)link_map地址 操作系統(tǒng)運行程序時,首先將解釋器程序即動態(tài)鏈接器ld.so映射到一個合適的地址,然后啟動 ld.so。ld.so 先完成自己的初始化工作,再從可執(zhí)行文件的動態(tài)庫依賴表中指定的路徑名查找所需要的庫,將其加載映射到內(nèi)存。Linux用一個全局的庫映射信息結(jié)構(gòu)struct link_map鏈表來管理和控制所有動態(tài)庫的加載,動態(tài)庫的加載過程實際上是映射庫文件到內(nèi)存中,并填充庫映射信息結(jié)構(gòu)添加到鏈表中的過程。結(jié)構(gòu) struct link_map描述共享目標(biāo)文件的加載映射信息,是動態(tài)鏈接器在運行時內(nèi)部使用的一個結(jié)構(gòu),通過它保持對已裝載的庫和庫中符號的跟蹤 link_map使用雙向鏈接中間件"l_next"和"l_prev"鏈接進(jìn)程中所有加載的共享庫。當(dāng)動態(tài)鏈接器需要去查找符號的時候,可以向前或向后遍歷這個鏈表,通過訪問鏈表上的每一個庫去搜索需要查找的符號 //Link_map鏈表的入口由每個可執(zhí)行映像的全局偏移表的第2個入口(GOT[1])指向,查找符號時先從 GOT[1]讀取 link_map 結(jié)點地址,然后沿著link-map 結(jié)點進(jìn)行搜索 2. GOT+8(即 GOT[2]): 設(shè)置動態(tài)鏈接器符號解析函數(shù)的地址_dl_runtime_resolve PLT的第1個入口PLT0是一段訪問動態(tài)鏈接器的特殊代碼。程序?qū)LT入口的第1次訪問都轉(zhuǎn)到了PLT0,最后跳入GOT[2]存儲的地址執(zhí)行符號解析函數(shù)。待完成符號解析后,將符號的實際地址存入相應(yīng)的GOT項,這樣以后調(diào)用函數(shù)時可直接跳到實際的函數(shù)地址,不必再執(zhí)行符號解析函數(shù)動態(tài)庫的加載映射過程主要分3步
1. 動態(tài)鏈接器調(diào)用__mmap函數(shù)對動態(tài)庫的所有PT_LOAD可加載段進(jìn)行整體映射 /* l_map_start=(ElfW(Addr))__mmap ((void *)0, maplength, prot, MAP_COPY | MAP_FILE, fd, mapoff); */ 返回值 l_map_start 是實際映射的虛擬地址,和段結(jié)構(gòu)成員,p_vaddr指定的虛擬地址不一定相同,這對于位置無關(guān)代碼不會產(chǎn)生影響。但是對于數(shù)據(jù)段和link_map結(jié)構(gòu)中其它相關(guān)的位置描述信息還要進(jìn)行修正 2. 共享文件映射完畢,動態(tài)鏈接器處理共享庫的PT_DYNAMIC動態(tài)段,將各項動態(tài)鏈接信息主要是哈希表、符號表、字符串表、重定位表、PLT 重定位項表等地址填寫到link_map的l_info數(shù)組結(jié)構(gòu)中。l_info是link_map最重要的字段之一,幾乎所有與動態(tài)鏈接管理相關(guān)的內(nèi)容都與l_info數(shù)組有關(guān)。動態(tài)鏈接器還要加載處理當(dāng)前共享庫的所有依賴庫3. 由于實際的映射地址和指定的虛擬地址有可能不同,因此還要對動態(tài)庫及其依賴庫進(jìn)行重定位。設(shè)置動態(tài)庫的第1個和第2個GOT 表項 /* Elf32_Addr *got = (Elf32_Addr *) lmap->l_info[DT_PLTGOT].d_un.d_ptr; got[1]=lmap; got[2]=&_dl_runtime_resolve; */ 對動態(tài)庫的所有重定位項進(jìn)行重定位,在重定位項指定的偏移地址處加上修正值l_addr。動態(tài)項DT_REL給出了重定位表的地址,DT_RELSZ給出重定位表項的數(shù)目,映射完畢后,動態(tài)鏈接器調(diào)用共享庫(包括所有相關(guān)的依賴庫)自備的初始化函數(shù)進(jìn)行初始化Relevant Link:
http://zhiwei.li/text/2009/04/elf%E7%9A%84got%E5%92%8Cplt%E4%BB%A5%E5%8F%8Apic/#comment-4235 http://www.programlife.net/linux-got-plt.html?
3. 延遲版定(PLT Procedure Linkage Table)
我們知道,動態(tài)鏈接比靜態(tài)鏈接慢的主要原因有如下幾個
1. 動態(tài)鏈接下對于全局和靜態(tài)的數(shù)據(jù)訪問都要進(jìn)行復(fù)雜的的GOT定位,然后間接尋址,對于模塊間的調(diào)用也要先定位GOT,然后再進(jìn)行間接跳轉(zhuǎn) 2. 動態(tài)鏈接的鏈接工作是在運行時完成的,動態(tài)鏈接器會尋找并裝載所需要的共享對象,然后進(jìn)行符號查找地址重定位工作等0x1: 延遲綁定的實現(xiàn)
在動態(tài)鏈接下,程序模塊間包含了大量的函數(shù)引用,所以在程序開始執(zhí)行前,動態(tài)鏈接器會耗費大量時間用于解決模塊間的函數(shù)引用的符號查找以及重定位。但是需要明白的是,在一個程序運行過程中,可能很多函數(shù)在程序執(zhí)行完時都不會被用到,例如一些錯誤處理函數(shù)或者是一些很少運行到的代碼邏輯流支,如果一開始就把所有函數(shù)都鏈接好實際上是一種浪費,所以ELF采用了一種延遲綁定(Lazy Binding)技術(shù),即當(dāng)函數(shù)第一次被用到時才進(jìn)行綁定(符號查找、重定位等),如果這個函數(shù)沒有被用到則不進(jìn)行綁定。
采用了延遲綁定技術(shù)后,程序開始運行時,模塊間的函數(shù)調(diào)用全都沒有進(jìn)行綁定,而是需要用到時才由動態(tài)鏈接器來負(fù)責(zé)綁定
ELF使用PLT(Procedure Linkage Table)的方法來實現(xiàn),在Glibc中,實現(xiàn)延遲綁定功能的函數(shù)名叫"_dl_runtime_resolve()"
在開始學(xué)習(xí)PLT技術(shù)之前,我們來總結(jié)一下ELF中這種技術(shù)的核心思想
不管是模塊間的指令調(diào)用、還是跨模塊的全局靜態(tài)變量的引用,ELF使用了GOT間接跳轉(zhuǎn)來實現(xiàn),本質(zhì)上是使用了"中間層技術(shù)"來屏蔽可能存在的外部模塊引入的不確定性,中間層技術(shù)是實現(xiàn)兼容的一種很好的思考方式PLT為了實現(xiàn)延遲綁定,在GOT的基礎(chǔ)之上又增加了一層間接跳轉(zhuǎn),調(diào)用函數(shù)并不直接通過GOT跳轉(zhuǎn),而是通過一個叫做PLT項的結(jié)構(gòu)來進(jìn)行跳轉(zhuǎn)。每個外部函數(shù)在PLT中有一個相應(yīng)的項
?
4. 動態(tài)鏈接相關(guān)結(jié)構(gòu)
在動態(tài)鏈接情況下,可執(zhí)行文件的裝載與靜態(tài)鏈接的情況基本一樣
1. 操作系統(tǒng)讀取可執(zhí)行文件的頭部,檢查文件的合法性 2. 從頭部中的"Program Header"中讀取每個"Segment"的虛擬地址、文件地址和屬性,并將它們映射到進(jìn)程虛擬空間的相對位置 3. 在靜態(tài)鏈接情況下,這個時候操作系統(tǒng)就可以把控制權(quán)交給可執(zhí)行文件的入口地址,然后程序開始執(zhí)行但是在動態(tài)鏈接情況下,操作系統(tǒng)不能在裝載完可執(zhí)行文件之后就把控制權(quán)交給可執(zhí)行文件,因為可執(zhí)行文件依賴于很多動態(tài)共享對象(DSO),這個時候,可執(zhí)行文件對于很多外部符號的引用還處于無效地址的狀態(tài),即還沒有跟相應(yīng)的共享對象中的實際位置鏈接起來,所以在映射完可執(zhí)行文件之后,操作系統(tǒng)會先啟動一個動態(tài)鏈接器(Dynamic Linker)
在Linux中,動態(tài)鏈接器ld.so實際上也是一個共享對象
1. 操作系統(tǒng)同樣通過映射的方式將它加載到進(jìn)程的地址空間中 2. 操作系統(tǒng)在加載完動態(tài)鏈接器之后,就將控制權(quán)交給動態(tài)鏈接器的入口地址(與可執(zhí)行文件一樣,共享對象也有入口地址) 3. 當(dāng)動態(tài)鏈接器得到控制權(quán)之后,它開始執(zhí)行一系列自身的初始化操作,然后根據(jù)當(dāng)前的環(huán)境參數(shù),開始對可執(zhí)行文件進(jìn)行動態(tài)鏈接工作 4. 當(dāng)所有動態(tài)鏈接工作完成之后,動態(tài)鏈接器會將控制權(quán)轉(zhuǎn)交到可執(zhí)行文件的入口地址,程序開始正式執(zhí)行0x1: .interp段
值得注意的是,動態(tài)鏈接器的位置既不是系統(tǒng)配置決定、也不是由環(huán)境參數(shù)決定,而是由ELF文件自身決定。在動態(tài)鏈接的ELF可執(zhí)行文件中,有一個專門的段叫作 ".interp段"(interpreter(解釋器)段)
objdump -s main".interp"里保存的就是一個字符串,表明可執(zhí)行文件所需要的動態(tài)鏈接器的路徑,在Linux中,操作系統(tǒng)在對可執(zhí)行文件進(jìn)行加載的時候,會去尋找裝載該可執(zhí)行文件所需要的相應(yīng)的動態(tài)鏈接器,即".interp"段指定的路徑的共享對象
動態(tài)鏈接器在Linux下是Glibc的一部分,也是屬于系統(tǒng)庫級別的,它的版本號往往跟系統(tǒng)中的Glibc庫版本號一致,當(dāng)系統(tǒng)中的Glibc庫更新或者安裝其他版本的時候,/lib64/ld-linux.so.2這個軟鏈接就是指向到新的動態(tài)鏈接器,而可執(zhí)行文件本身不需要修改".interp"段中的動態(tài)鏈接器的路徑來適應(yīng)系統(tǒng)的升級,這又是利用中間層思想帶來的兼容性的一個例子
0x2: .dynamic段?
動態(tài)鏈接器ELF中最重要的結(jié)構(gòu)應(yīng)該是".dynamic"段,這個段里面保存了動態(tài)鏈接器所需要的基本信息,例如依賴哪些共享對象、動態(tài)鏈接符號表的位置動態(tài)鏈接重定位表的位置、共享對象初始化代碼的地址等
linux-2.6.32.63\include\linux\elf.h
typedef struct dynamic {Elf32_Sword d_tag;union{Elf32_Sword d_val;Elf32_Addr d_ptr;} d_un; } Elf32_Dyn;typedef struct {/* entry tag value : 類型值#define DT_NULL 0#define DT_NEEDED 1#define DT_PLTRELSZ 2#define DT_PLTGOT 3#define DT_HASH 4 : 動態(tài)鏈接哈希表地址,d_ptr表示".hash"的地址#define DT_STRTAB 5 : 動態(tài)鏈接字符串表的地址,d_ptr表示".dynstr"的地址#define DT_SYMTAB 6 : 動態(tài)鏈接符號表的地址,d_ptr表示".dynsym"的地址#define DT_RELA 7 : 動態(tài)鏈接重定位表地址#define DT_RELASZ 8#define DT_RELAENT 9#define DT_STRSZ 10 : 動態(tài)鏈接字符串表大小,d_val表示大小 #define DT_SYMENT 11#define DT_INIT 12 : 初始化代碼地址#define DT_FINI 13 : 結(jié)束代碼地址#define DT_SONAME 14 : 本共享對象的"SO-NAME"#define DT_RPATH 15 : 動態(tài)鏈接共享對象搜索路徑#define DT_SYMBOLIC 16#define DT_REL 17#define DT_RELSZ 18#define DT_RELENT 19 : 動態(tài)重讀位表入口數(shù)量#define DT_PLTREL 20#define DT_DEBUG 21#define DT_TEXTREL 22#define DT_JMPREL 23#define DT_ENCODING 32#define OLD_DT_LOOS 0x60000000#define DT_LOOS 0x6000000d#define DT_HIOS 0x6ffff000#define DT_VALRNGLO 0x6ffffd00#define DT_VALRNGHI 0x6ffffdff#define DT_ADDRRNGLO 0x6ffffe00#define DT_ADDRRNGHI 0x6ffffeff#define DT_VERSYM 0x6ffffff0#define DT_RELACOUNT 0x6ffffff9#define DT_RELCOUNT 0x6ffffffa#define DT_FLAGS_1 0x6ffffffb#define DT_VERDEF 0x6ffffffc#define DT_VERDEFNUM 0x6ffffffd#define DT_VERNEED 0x6ffffffe#define DT_VERNEEDNUM 0x6fffffff#define OLD_DT_HIOS 0x6fffffff#define DT_LOPROC 0x70000000#define DT_HIPROC 0x7fffffff*/Elf64_Sxword d_tag; union {Elf64_Xword d_val;Elf64_Addr d_ptr;} d_un; } Elf64_Dyn;從作用上來說,".dynamic"段里保存的信息類似于ELF文件頭,使用readelf -d hook.so可以查看".dynamic"段的內(nèi)容
Linux還提供了一個指令來查看一個程序主模塊、或者一個共享庫依賴于哪些共享庫: ldd programe
0x3: 動態(tài)符號表?
為了完成動態(tài)鏈接,最關(guān)鍵的是所依賴的符號和相關(guān)文件的信息。為了表示動態(tài)鏈接這些模塊之間的符號導(dǎo)入導(dǎo)出關(guān)系,ELF專門有一個叫作動態(tài)符號表(dynamic symbol table)的段,這個段的段名通常為".dynsym"(dynamic symbol)。與".symtab"類似,動態(tài)符號表也需要一些輔助的表,比如用于保存符號名的字符串表,即動態(tài)符號字符串表".dynstr"(dynamic string table),由于在動態(tài)鏈接下,我們需要在程序運行時查中啊符號,為了加快符號的查找過程,往往還有輔助的符號哈希表".hash"
0x4: 動態(tài)鏈接重定位表
動態(tài)鏈接下,無論是可執(zhí)行文件還是共享對象,只要它依賴于其他共享對象,也就是說有導(dǎo)入的符號時,那么它的代碼或數(shù)據(jù)中就會有對于導(dǎo)入符號的引用,在編譯時這些導(dǎo)入符號的地址未知,在靜態(tài)鏈接中,這些未知的地址引用在最終鏈接時會被重定位修正,但是在動態(tài)鏈接中,導(dǎo)入符號的地址在運行時才確定,所以需要在運行時將這些導(dǎo)入符號的引用修正,即需要動態(tài)重定位
1. ".rel.dyn" 對數(shù)據(jù)引用的修正,它所修正的位置位于".got"以及數(shù)據(jù)段2. ".rel.plt" 對函數(shù)引用的修正,它所修正的位置位于".got.plt"0x5: 動態(tài)鏈接時進(jìn)程堆棧初始化信息
進(jìn)程初始化的時候,堆棧里保存了關(guān)于進(jìn)程執(zhí)行環(huán)境和命令行參數(shù)等信息,除此之外,堆棧里還保存了動態(tài)鏈接器所需要的一些輔助信息數(shù)組(auxiliary vevtor)
linux-2.6.32.63\include\linux\elf.h
typedef struct {/* Entry type #define AT_NULL 0 : 表示輔助信息數(shù)組結(jié)束#define AT_IGNORE 1 #define AT_EXECFD 2 : 表示可執(zhí)行文件的文件句柄#define AT_PHDR 3 : 可執(zhí)行文件中"程序頭表(program header)"在進(jìn)程中的地址#define AT_PHENT 4 : 可執(zhí)行文件中程序頭表每一個入口(entry)的大小#define AT_PHNUM 5 : 可執(zhí)行文件頭中程序頭表中入口(entry)的數(shù)量#define AT_PAGESZ 6 #define AT_BASE 7 : 表示動態(tài)鏈接器本身的裝載地址#define AT_FLAGS 8 #define AT_ENTRY 9 : 可執(zhí)行文件入口地址,即啟動地址#define AT_NOTELF 10 #define AT_UID 11 #define AT_EUID 12 #define AT_GID 13 #define AT_EGID 14 #define AT_CLKTCK 17 */u64 a_type; union{u64 a_val; /* Integer value */} a_un; } Elf64_auxv_t;事實上,輔助信息位于環(huán)境變量指針的后面
#include <stdio.h> #include <elf.h>int main(int argc, char* argv[]) {int* p = (int*)argv;int i;Elf32_auxv_t* aux;printf("Argument count: %d\n", *(p - 1));for(i = 0; i < *(p - 1); i++){printf("Argument %d: %s\n", i, *(p + 1));}p += i;p++;//skip 0 printf("Environment: \n");while(*p){printf("%s\n", *p);p++;}p++;//skip 0 printf("Auxiliary Vectors: \n");aux = (Elf32_auxv_t*)p;while(aux->a_type != AT_NULL){printf("Type: %02d Value: %x\n", aux->a_type, aux->a_un.a_val);aux++;}return 0; }?
5. 動態(tài)鏈接的步驟和實現(xiàn)
動態(tài)鏈接基本上分為3步
1. 啟動動態(tài)鏈接器本身(自舉) 2. 裝載所有需要的共享對象 3. 重定位、初始化0x1: 動態(tài)鏈接器自舉
我們知道,對于Linux程序中的普通共享對象(DSO)文件來說
1. 普通DSO的重定位工作由動態(tài)鏈接器來完成 2. 普通DSO依賴的其他共享對象由動態(tài)鏈接器負(fù)責(zé)鏈接和裝載而對于動態(tài)鏈接器對應(yīng)的DSO文件來說
1. 動態(tài)鏈接器本身不可以依賴于其他任何共享對象 編寫動態(tài)鏈接器時保證不使用任何系統(tǒng)庫、運行庫2. 動態(tài)鏈接器本身所需要的全局和靜態(tài)變量的重定位工作由它本身完成動態(tài)鏈接器必須在啟動時有一段很精巧的代碼可以完成這項艱巨的工作同時又不能用到全局和靜態(tài)變量。這種具有一定限制條件的啟動代碼往往被稱為"自舉(Boosttrap)"
1. 動態(tài)鏈接器入口地址就是自舉代碼的入口,當(dāng)操作系統(tǒng)將進(jìn)程控制權(quán)交給動態(tài)鏈接器時,動態(tài)鏈接器的自舉代碼即開始執(zhí)行 2. 自舉代碼會找到自己的GOT。而GOT的第一個入口保存的即是".dynamic"段的偏移地址,由此獲得了動態(tài)鏈接器本身的".dynamic"段 3. 通過".dynamic"段中的信息,自舉代碼便可以獲得動態(tài)鏈接器本身的重定位表和符號表等,從而得到動態(tài)鏈接器本身的重定位入口,先將它們?nèi)恐囟ㄎ?4. 從這一步開始動態(tài)鏈接器代碼中才可以開始使用自己的全局變量和靜態(tài)變量0x2: 裝載共享對象
完成基本自舉后,動態(tài)鏈接器將可執(zhí)行文件和鏈接器自身的符號表都合并到一個符號表中,我們稱之為"全局符號表(Global Symbol Table)"。然后鏈接器開始尋找可執(zhí)行文件所依賴的共享對象,在".dynamic"段中,有一種類型的入口是DT_NEEDED,它標(biāo)識了該可執(zhí)行文件(或共享對象)所依賴的共享對象。由此
1. 鏈接器可以列出可執(zhí)行文件所需要的所有共享對象,并將這些共享對象的名字放入到一個裝載集合中 2. 然后鏈接器開始從集合里取一個所需要的共享對象的名字,找到相應(yīng)的文件后打開該文件,讀取相應(yīng)的ELF文件頭和".dynamic"段,然后將它相應(yīng)的代碼段和數(shù)據(jù)段映射到進(jìn)程空間中 3. 如果這個ELF共享對象還依賴于其他共享對象,那么將所依賴的共享對象的名字放到裝載集合中,如果循環(huán)知道所有依賴的共享對象都被裝載進(jìn)來為止 4. 鏈接器對共享對象的遍歷過程本質(zhì)上是一個圖的遍歷過程,鏈接器可能會使用深度優(yōu)先、或者廣度優(yōu)先的順序來進(jìn)行 5. 當(dāng)一個新的共享對象被裝載進(jìn)來的時候,它的符號表會被合并到全局符號表中,所以當(dāng)所有的共享對象都被裝載進(jìn)來的時候,全局符號表里面將包含進(jìn)程中所有動態(tài)鏈接鎖需要的符號符號優(yōu)先級
在動態(tài)鏈接器按照各個模塊之間的依賴關(guān)系,對它們進(jìn)行裝載并且將它們的符號"合并"到全局符號表時,會發(fā)生兩個不同的模塊定義了一個同名的符號
編寫示例代碼模擬這個場景
當(dāng)動態(tài)鏈接器對main程序進(jìn)行動態(tài)鏈接時,b1.so、b2.so、a1.so、a2.so都會被裝載到進(jìn)程的地址空間中,并且它們的符號都會被"合并"到全局符號表中,當(dāng)發(fā)生同名符號重合的情況時,這種現(xiàn)象叫做"全局符號介入(global symbol interpose)"
Linux下的動態(tài)鏈接器的處理規(guī)則是這樣的
0x3: 重定位和初始化
當(dāng)完成動態(tài)鏈接器的裝載、普通共享對象的裝載之后,鏈接器開始重新遍歷可執(zhí)行文件和每個共享對象的重定位表,將它們的GOT/PLT中的每個需要重定位的位置進(jìn)行修正
重定位完成后就,如果某個共享對象有".init"段,那么動態(tài)鏈接器會執(zhí)行".init"段中的代碼,用以實現(xiàn)共享對象特有的初始化過程,例如共享對象中的C++全局/靜態(tài)對象的構(gòu)造就是通過"init"段來初始化
當(dāng)完成了重定位和初始化后,所有的準(zhǔn)備工作就宣告完成了,所需要的共享對象也都已經(jīng)裝載并且鏈接完成了,這個時候進(jìn)程的控制權(quán)就由動態(tài)鏈接器轉(zhuǎn)交給程序的入口并且開始執(zhí)行
Relevant Link:
?
6. Linux動態(tài)鏈接器實現(xiàn)
Linux動態(tài)鏈接器本身是一個共享對象,它的路徑是"/lib/ld-linux.so.2、/lib64/ld-linux-x86-64.so.2"。共享對象本質(zhì)上也是一個ELF文件,包含ELF文件頭(包括e_entry、段表等),而動態(tài)鏈接器是個非常特殊的共享對象,它不僅是個共享對象,還是一個可執(zhí)行程序,可以直接在命令行下運行
/lib64/ld-linux-x86-64.so.2Linux的ELF動態(tài)鏈接器是glibc的一部分,它的源代碼位于glibc的源代碼的ELF目錄下
\glibc-2.18\sysdeps\i386\dl-machine.h
/* Initial entry point code for the dynamic linker.The C function `_dl_start' is the real entry point;its return value is the user program's entry point. */#define RTLD_START asm ("\n\.text\n\.align 16\n\ 0: movl (%esp), %ebx\n\ret\n\.align 16\n\ .globl _start\n\ .globl _dl_start_user\n\ _start:\n\# Note that _dl_start gets the parameter in %eax.\n\movl %esp, %eax\n\call _dl_start\n\ _dl_start_user:\n\# Save the user entry point address in %edi.\n\movl %eax, %edi\n\# Point %ebx at the GOT.\n\call 0b\n\addl $_GLOBAL_OFFSET_TABLE_, %ebx\n\# See if we were run as a command with the executable file\n\# name as an extra leading argument.\n\movl _dl_skip_args@GOTOFF(%ebx), %eax\n\# Pop the original argument count.\n\popl %edx\n\# Adjust the stack pointer to skip _dl_skip_args words.\n\leal (%esp,%eax,4), %esp\n\# Subtract _dl_skip_args from argc.\n\subl %eax, %edx\n\# Push argc back on the stack.\n\push %edx\n\# The special initializer gets called with the stack just\n\# as the application's entry point will see it; it can\n\# switch stacks if it moves these contents over.\n\ " RTLD_START_SPECIAL_INIT "\n\# Load the parameters again.\n\# (eax, edx, ecx, *--esp) = (_dl_loaded, argc, argv, envp)\n\movl _rtld_local@GOTOFF(%ebx), %eax\n\leal 8(%esp,%edx,4), %esi\n\leal 4(%esp), %ecx\n\movl %esp, %ebp\n\# Make sure _dl_init is run with 16 byte aligned stack.\n\andl $-16, %esp\n\pushl %eax\n\pushl %eax\n\pushl %ebp\n\pushl %esi\n\# Clear %ebp, so that even constructors have terminated backchain.\n\xorl %ebp, %ebp\n\# Call the function to run the initializers.\n\call _dl_init_internal@PLT\n\# Pass our finalizer function to the user in %edx, as per ELF ABI.\n\leal _dl_fini@GOTOFF(%ebx), %edx\n\# Restore %esp _start expects.\n\movl (%esp), %esp\n\# Jump to the user's entry point.\n\jmp *%edi\n\.previous\n\ ");執(zhí)行流程如下
1. _start()調(diào)用_dl_start()函數(shù) 2. _dl_start()首先對ld-x.y.z.so進(jìn)行重定位,因為ld-x.y.z.so自身是動態(tài)鏈接器,它必須自己完成重定位,即"自舉" 3. 完成自舉后就可以調(diào)用其他函數(shù)、并且訪問全局變量了 4. 調(diào)用_dl_start_final()收集一些基本的運行數(shù)值,進(jìn)入_dl_sysdep_start() 5. _dl_sysdep_start()進(jìn)行了一些平臺相關(guān)的處理之后就進(jìn)入了_dl_main(),這是動態(tài)鏈接器的主函數(shù)Relevant Link:
http://mirror.hust.edu.cn/gnu/glibc/?
7. 顯式運行時鏈接
支持動態(tài)鏈接的系統(tǒng)大部分都支持一種更加靈活的模塊加載方式,即"顯式運行時鏈接(explicit run-time linking)(運行時加載)"。讓程序自己在運行時控制加載指定的模塊,并且可以在不需要該模塊時將其卸載
在Linux中,從文件本身的格式上來看,動態(tài)庫實際上和共享對象庫沒有區(qū)別,主要的區(qū)別是
1. 共享對象是由動態(tài)鏈接器在程序啟動之前負(fù)責(zé)裝載和鏈接的,這一系列步驟都由動態(tài)鏈接器自動完成,對于程序本身是透明的2. 動態(tài)庫的裝載是通過一些列的動態(tài)鏈接器提供的API按成的 /* #include <dlfcn.h> /lib.lindl.so.2 */0x1: dlopen()
打開一個動態(tài)鏈接庫,將其加載到進(jìn)程的地址空間,并返回動態(tài)鏈接庫的句柄,完成初始化過程
void * dlopen( const char * pathname, int mode); 1. pathname: 被加載動態(tài)庫的路徑 值得注意的是: 如果pathname傳入是0,則dlopen返回的是全局符號表的句柄,也就是說我們可以在運行時找到全局符號表里面的任何一個符號,并且可以執(zhí)行它們,這類似于高級語言中的反射(relection)特性 全局符號表包括了程序的可執(zhí)行文件本身、被動態(tài)鏈接器加載到進(jìn)程中的所有共享模塊、運行時通過dlopen打開并且使用了RTLD_GLOBAL方式的模塊中的符號2. mode: mode是打開方式,其值有多個,不同操作系統(tǒng)上實現(xiàn)的功能有所不同,在linux下,按功能可分為三類:2.1 解析方式1) RTLD_LAZY: 在dlopen返回前,對于動態(tài)庫中的未定義的符號不執(zhí)行解析(只對函數(shù)引用有效,對于變量引用總是立即解析)2) RTLD_NOW: 需要在dlopen返回前,解析出所有未定義符號,如果解析不出來,在dlopen會返回NULL,錯誤為:: undefined symbol: xxxx.......2.2 作用范圍: 可與解析方式通過"|"組合使用 1) RTLD_GLOBAL: 動態(tài)庫中定義的符號可被其后打開的其它庫解析 2) RTLD_LOCAL: 與RTLD_GLOBAL作用相反,動態(tài)庫中定義的符號不能被其后打開的其它庫重定位。如果沒有指明是RTLD_GLOBAL還是RTLD_LOCAL,則缺省為RTLD_LOCAL 2.3 作用方式1) RTLD_NODELETE: 在dlclose()期間不卸載庫,并且在以后使用dlopen()重新加載庫時不初始化庫中的靜態(tài)變量。這個flag不是POSIX-2001標(biāo)準(zhǔn) 2) RTLD_NOLOAD: 不加載庫。可用于測試庫是否已加載(dlopen()返回NULL說明未加載,否則說明已加載),也可用于改變已加載庫的flag,如:先前加載庫的flag為RTLD_LOCAL,用dlopen(RTLD_NOLOAD|RTLD_GLOBAL)后flag將變成RTLD_GLOBAL。這個flag不是POSIX-2001標(biāo)準(zhǔn) 3) RTLD_DEEPBIND: 在搜索全局符號前先搜索庫內(nèi)的符號,避免同名符號的沖突。這個flag不是POSIX-2001標(biāo)準(zhǔn)dlopen會嘗試以一定的順序去查找動態(tài)庫文件
1. 查找環(huán)境變量LD_LIBRARY_PATH指定的一些列目錄 2. 查找由/etc/ld.so.cache指定的共享庫路徑 3. /lib/、/usr/lib0x2: dlsym()
根據(jù)動態(tài)鏈接庫操作句柄與符號,返回符號對應(yīng)的地址
#include <dlfcn.h> void * dlsym(void *handle, constchar *symbol)符號優(yōu)先級
我們可以使用下面的代碼來幫助我們理解這個原理
/* hook.c */ #include <stdio.h> #include <string.h> #include <dlfcn.h> int strcmp(const char *s1, const char *s2) { //這個hook函數(shù)只是簡單地打印一句話printf("oops!!! hack function invoked\n"); } gcc -fPIC -shared -o hook.so hook.c -ldl cp hook.so /lib64//* main.c */ #include <stdio.h> #include <dlfcn.h>int main(int argc, char **argv) {void *handle1, *handle2;int (*cosine1)(const char *, const char *);int (*cosine2)(const char *, const char *);char *error;//返回hook.so的模塊句柄handle1 = dlopen ("hook.so", RTLD_LAZY);//返回全局符號表handle2 = dlopen (0, RTLD_LAZY);if (!handle1 | !handle2) {fprintf (stderr, "%s\n", dlerror());return 0;}//從剛才打開的句柄中搜索符號cosine1 = dlsym(handle1, "strcmp");//從全局符號表中搜索符號cosine2 = dlsym(handle2, "strcmp");if ((error = dlerror()) != NULL) {fprintf (stderr, "%s\n", error);return 0;}//采用依賴序列(dependency ordering)優(yōu)先級進(jìn)行符號搜索,優(yōu)先執(zhí)行動態(tài)引入的hook.so的函數(shù)printf ("%f\n", (*cosine1)("aaa", "bbb"));//采用裝載序列(load ordering)優(yōu)先級啊進(jìn)行符號搜索,動態(tài)引入的hook.so被忽略printf ("%f\n", (*cosine2)("aaa", "bbb"));dlclose(handle1);dlclose(handle2);return 0; } gcc -rdynamic -o main main.c -ldl0x3: dlclose()
dlclose()的作用和dlopen()相反,它的作用是將一個已加載的模塊卸載,系統(tǒng)會維持一個加載引用的計數(shù)器
1. dlopen 計數(shù)器加12. dlclose 計數(shù)器減1 只有當(dāng)計數(shù)器減到0時,模塊才被真正地卸載掉,卸載的過程正好相反,先執(zhí)行".finit"段代碼,然后將相應(yīng)的符號從符號表中去除,取消進(jìn)程空間跟模塊的映射關(guān)系,然后關(guān)閉模塊文件?
8. 共享庫系統(tǒng)路徑 && 默認(rèn)加載順序
目前大多數(shù)包括Linux在內(nèi)的開源操作系統(tǒng)都遵守FHS(File Hierarchy Standard 文件系統(tǒng)層次結(jié)構(gòu)標(biāo)準(zhǔn))標(biāo)準(zhǔn),它包括了以下目錄結(jié)構(gòu)
1. / : 第一層次結(jié)構(gòu)的根,整個文件系統(tǒng)層次結(jié)構(gòu)的根目錄 2. /bin/ : 需要在單用戶模式可用的必要命令(可執(zhí)行文件),例如 1) cat2) ls3) cp 3. /boot/ : 引導(dǎo)程序文件,例如 1) kernel2) initrd 4. /dev/ : 必要設(shè)備,例如 1) /dev/null 5. /etc/ : 系統(tǒng)范圍內(nèi)的配置文件 6. /home/ : 用戶的工作目錄,包含保存的文件、個人設(shè)置等 7. /lib/ : /bin/、/sbin/中二進(jìn)制文件必要的庫文件 8. /media/ : 可移除媒體(如CD-ROM)的掛載點(在FHS-2.3中出現(xiàn)) 9. /mnt/ : 臨時掛載的文件系統(tǒng) 10. /opt/ : 可選應(yīng)用軟件包 11. /proc/ : 虛擬文件系統(tǒng),將內(nèi)核與進(jìn)程狀態(tài)歸檔為文本文件,例如 1) uptime2) network 在Linux中,對應(yīng)Procfs格式掛載 12. /root/ : 超級用戶的工作目錄 13. /sbin/ : 必要的系統(tǒng)二進(jìn)制文件,例如1) init2) ip3) mount 14. /srv/ : 站點的具體數(shù)據(jù),由系統(tǒng)提供 15. /tmp/ : 臨時文件(參見 /var/tmp),在系統(tǒng)重啟時目錄中文件不會被保留 16. /usr/ : 用于存儲用戶數(shù)據(jù),包含絕大多數(shù)的(多)用戶工具和應(yīng)用程序 17. /var/遵循這種約定標(biāo)準(zhǔn),它有助于促進(jìn)各個開源操作系統(tǒng)之間兼容性,按照FHS規(guī)定,一個系統(tǒng)中主要有3個存放共享庫的位置
1. /lib: 存放系統(tǒng)最關(guān)鍵和基礎(chǔ)的共享庫,例如1) 動態(tài)鏈接器2) C語言運行庫3) 數(shù)學(xué)庫 這些庫主要是那些/bin、/sbin下的程序以及系統(tǒng)啟動時所要用到的庫2. /usr/lib: 存放一些非系統(tǒng)運行時所需要的關(guān)鍵性的共享庫,只要是一些開發(fā)時用到的共享庫3. /usr/local/lib: 存放一些跟操作系統(tǒng)本身并不十分相關(guān)的庫,主要是一些第三方的應(yīng)用程序的庫0x1: 共享庫的查找過程
我們知道,包括Linux系統(tǒng)在內(nèi)的很多開源系統(tǒng)都是基于Glibc的,動態(tài)鏈接的ELF可執(zhí)行文件在啟動時同時會啟動動態(tài)鏈接器(/lib/ld-linux.so.X),程序所依賴的共享對象全部由動態(tài)鏈接器負(fù)責(zé)裝載和初始化,所以這里所謂的共享庫的查找過程,本質(zhì)上就是動態(tài)鏈接器(/lib/ld-linux.so.X)對共享庫路徑的搜索過程,搜索過程如下
1. 根據(jù)ELF文件中的配置信息 任何一個動態(tài)鏈接的模塊所依賴的模塊路徑保存在".dynamic"段中,由DT_NEED類型的項表示,動態(tài)鏈接器會按照這個路徑去查找DT_RPATH所指定的路徑,編譯目標(biāo)代碼時,可以對gcc加入鏈接參數(shù)"-Wl,-rpath"指定動態(tài)庫搜索路徑 2. DT_NEED段中保存的是絕對路徑,則動態(tài)鏈接器直接按照這個路徑進(jìn)行直接加載3. 根據(jù)LD_PRELOAD中指定的路徑加載共享庫、目標(biāo)文件/* 4. /etc/ld.so.cache 到了這一步,如果動態(tài)鏈接器(/lib/ld-linux.so.X)沒有得到可以直接打開的絕對路徑,則需要開始根據(jù)相對路徑進(jìn)行共享庫的搜索 Linux為了加速這個搜索過程,在系統(tǒng)中建立了一個ldconfig程序,這個程序負(fù)責(zé)1) 將共享庫下的各個共享庫維護(hù)一個SO-NAME(一一對應(yīng)的符號鏈接),這樣每個共享庫的SO-NAME就能夠指向正確的共享庫文件2) 將全部SO-NAME收集起來,集中放到/etc/ld.so.cache文件里面,并建立一個SO-NAME的緩存 當(dāng)動態(tài)鏈接器要查找共享庫時,它可以直接從/etc/ld.so.cache里面查找所以,如果我們在系統(tǒng)指定的共享庫目錄下添加、刪除或更新任何一個共享庫,或者我們更改了/etc/ld.so.conf、/etc/ld.preload的配置,都應(yīng)該運行一次ldconfig這個程序,以便更新SO-NAME和/etc/ld.so.cache 很多軟件包的安裝程序在結(jié)束共享庫安裝以后都會調(diào)用ldconfig */5. 根據(jù)/etc/ld.so.preload中的配置進(jìn)行搜索 這個配置文件中保存了需要搜索的共享庫路徑,Linux動態(tài)共享庫加載器根據(jù)順序進(jìn)行逐行廣度搜索6. 根據(jù)環(huán)境變量LD_LIBRARY_PATH指定的動態(tài)庫搜索路徑 7. DT_NEED段中保存的是相對路徑,動態(tài)鏈接器會在按照一個約定的順序進(jìn)行庫文件查找1) /lib2) /usr/lib3) 由/etc/ld.so.conf中配置指定的搜索路徑0x2: 環(huán)境變量: LD_LIBRARY_PATH
在Linux系統(tǒng)中,LD_LIBRARY_PATH是一個由若干個路徑組成的環(huán)境變量,每個路徑之間由冒號隔開,默認(rèn)情況下,LD_LIBRARY_PATH為空,設(shè)置方法如下
1. LD_LIBRARY_PATH=/home/user/ /bin/ls 2. /lib64/ld-linux.so.2 -library-path /home/user /bin/lsLD_LIBRARY_PATH對于共享庫的開發(fā)和測試十分方便,但是不應(yīng)該被濫用,隨意修改LD_LIBRARY_PATH并且將其導(dǎo)出至全局范圍,將可能引起其他應(yīng)用程序運行出現(xiàn)問題。同時,LD_LIBRARY_PATH也會影響GCC編譯時查找?guī)斓穆窂?#xff0c;里里面包含的目錄相當(dāng)于鏈接時GCC的"-L"參數(shù)
0x3: 環(huán)境變量: LD_PRELOAD
借助這個環(huán)境變量,我們可以指定預(yù)先裝載的一些共享庫、目標(biāo)文件。它的優(yōu)先級是所有相對路徑搜索中最高的,無論程序是否需要它們,LD_PRELOAD指定的共享庫或目標(biāo)文件都會被加載
由于全局符號介入這個機(jī)制的存在,LD_PRELOAD里面指定的共享庫或目標(biāo)文件的全局符號就會覆蓋后面加載的同名全局符號,這使得我們可以很方便地實現(xiàn)改寫標(biāo)準(zhǔn)C庫中的某幾個函數(shù)而不影響其他函數(shù),對于程序測試和調(diào)試非常有用
0x4: 環(huán)境變量: LD_DEBUG
這個變量可以打開動態(tài)鏈接器的調(diào)試功能,當(dāng)我們設(shè)置這個變量時,動態(tài)鏈接器會在運行時打印出各種有用的調(diào)試信息,對于開發(fā)和調(diào)試共享庫有很大幫助
LD_DEBUG=files ./killme
18745: 18745: file=/usr/local/$LIB/aegis_monitor.so [0]; needed by ./killme [0]18745: file=/usr/local/$LIB/aegis_monitor.so [0]; generating link map18745: dynamic: 0x00007f981c8d9cd0 base: 0x00007f981c6d8000 size: 0x0000000000201f7818745: entry: 0x00007f981c6d8be0 phdr: 0x00007f981c6d8040 phnum: 518745: 18745: 18745: file=libc.so.6 [0]; needed by ./killme [0]18745: file=libc.so.6 [0]; generating link map18745: dynamic: 0x00007f981c6c3b40 base: 0x00007f981c336000 size: 0x000000000039390818745: entry: 0x00007f981c354e70 phdr: 0x00007f981c336040 phnum: 1018745: 18745: 18745: file=libdl.so.2 [0]; needed by /usr/local/lib64/aegis_monitor.so [0]18745: file=libdl.so.2 [0]; generating link map18745: dynamic: 0x00007f981c334da0 base: 0x00007f981c132000 size: 0x000000000020310018745: entry: 0x00007f981c132de0 phdr: 0x00007f981c132040 phnum: 918745: 18745: 18745: calling init: /lib64/libc.so.618745: 18745: 18745: calling init: /lib64/libdl.so.218745: 18745: 18745: calling init: /usr/local/lib64/aegis_monitor.so18745: 18745: 18745: initialize program: ./killme18745: 18745: 18745: transferring control: ./killme18745: 18745: 18745: calling fini: ./killme [0]18745: 18745: 18745: calling fini: /usr/local/lib64/aegis_monitor.so [0]18745: 18745: 18745: calling fini: /lib64/libdl.so.2 [0]18745: 18745: 18745: calling fini: /lib64/libc.so.6 [0]18745:動態(tài)鏈接器打印出了整個裝載過程,顯示程序依賴于哪個共享庫并且按照什么步驟裝載和初始化、共享庫裝載時的地址等
LD_DEBUG還可以設(shè)置成其他值
Relevant Link:
http://en.wikipedia.org/wiki/Filesystem_Hierarchy_Standard總結(jié)
以上是生活随笔為你收集整理的Linux Dynamic Shared Library LD Linker的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 连接第二个 insance 到 firs
- 下一篇: 关于Linux线程的线程栈以及TLS