手把手教你拦截Linux系统调用
一、什么是系統(tǒng)調用
系統(tǒng)調用?是內核提供給應用程序使用的功能函數,由于應用程序一般運行在?用戶態(tài),處于用戶態(tài)的進程有諸多限制(如不能進行 I/O 操作),所以有些功能必須由內核代勞完成。而內核就是通過向應用層提供?系統(tǒng)調用,來完成一些在用戶態(tài)不能完成的工作。
說白了,系統(tǒng)調用其實就是函數調用,只不過調用的是內核態(tài)的函數。但與普通的函數調用不同,系統(tǒng)調用不能使用?call?指令來調用,而是需要使用?軟中斷?來調用。在 Linux 系統(tǒng)中,系統(tǒng)調用一般使用?int 0x80?指令(x86)或者?syscall?指令(x64)來調用。
下面我們以?int 0x80?指令(x86)調用方式為例,來說明系統(tǒng)調用的原理。
二、系統(tǒng)調用原理
在 Linux 內核中,使用?sys_call_table?數組來保存所有系統(tǒng)調用,sys_call_table?數組每一個元素代表著一個系統(tǒng)調用的入口,其定義如下:
typedef?void?(*sys_call_ptr_t)(void);const?sys_call_ptr_t?sys_call_table[__NR_syscall_max+1]?=?{... };當應用程序需要調用一個系統(tǒng)調用時,首先需要將要調用的系統(tǒng)調用號(也就是系統(tǒng)調用所在?sys_call_table?數組的索引)放置到?eax?寄存器中,然后通過使用?int 0x80?指令觸發(fā)調用?0x80?號軟中斷服務。
0x80?號軟中斷服務,會通過以下代碼來調用系統(tǒng)調用,如下所示:
... call *sys_call_table(,%eax,8) ...上面的代碼會根據?eax?寄存器中的值來調用正確的系統(tǒng)調用,其過程如下圖所示:
整體流程
三、系統(tǒng)調用攔截
了解了系統(tǒng)調用的原理后,要攔截系統(tǒng)調用就很簡單了。那么如何攔截呢?
做法就是:我們只需要把?sys_call_table?數組的系統(tǒng)調用換成我們自己編寫的函數入口即可。比如,我們想要攔截?write()?系統(tǒng)調用,那么只需要將?sys_call_table?數組的第一個元素換成我們編寫好的函數(因為?write()?系統(tǒng)調用在?sys_call_table?數組的索引為1)。
要修改?sys_call_table?數組元素的值,步驟如下:
1. 獲取?sys_call_table?數組的地址
要修改?sys_call_table?數組元素的值,一般需要通過內核模塊來完成。因為用戶態(tài)程序由于內存保護機制,不能改寫內核態(tài)的數據。而內核模塊運行在內核態(tài),所以能夠跳過這個限制。
要修改?sys_call_table?數組元素的值,首先要獲取?sys_call_table?數組的虛擬內存地址(由于?sys_call_table?變量不是一個導出符號,所以內核模塊不能直接使用)。
要獲取?sys_call_table?數組的虛擬內存地址有兩種方法:
第一種方法:從?System.map?文件中讀取
System.map?是一份內核符號表,包含了內核中的變量名和函數名地址,在每次編譯內核時,自動生成。獲取?sys_call_table?數組的虛擬地址使用如下命令:
sudo?cat?/boot/System.map-`uname?-r`?|?grep?sys_call_table結果如下圖所示:
從上圖可知,sys_call_table?數組的虛擬地址為:ffffffff818001c0。
第二種方法:通過?kallsyms_lookup_name()?函數來獲取
從?System.map?文件中讀取的方法不是很優(yōu)雅,所以內核提供了一個名為?kallsyms_lookup_name()?的函數來獲取內核變量和內核函數的虛擬內存地址。
kallsyms_lookup_name()?函數的使用很簡單,只需要傳入要獲取虛擬內存地址的變量名即可,如下代碼所示:
#include?<linux/kallsyms.h>void?func()?{...unsigned?long?*sys_call_table;//?獲取?sys_call_table?的虛擬內存地址sys_call_table?=?(unsigned?long?*)kallsyms_lookup_name("sys_call_table");... }2. 設置 sys_call_table 數組為可寫狀態(tài)
是不是獲取到?sys_call_table?數組的虛擬地址就可以修改其元素的值呢?沒那么簡單。
由于?sys_call_table?數組處于寫保護區(qū)域,并不能直接修改其內容。但有兩種方法可以將寫保護暫時關閉,如下:
第一種方法:將?cr0?寄存器的第 16 位設置為零
cr0?控制寄存器的第 16 位是寫保護位,若設置為零,則允許超級權限往內核中寫入數據。這樣我們可以在修改?sys_call_table?數組的值前,將?cr0?寄存器的第 16 位清零,使其可以修改?sys_call_table?數組的內容。當修改完后,又將那一位復原即可。
代碼如下:
/**?設置cr0寄存器的第16位為0*/ unsigned?int?clear_and_return_cr0(void) {unsigned?int?cr0?=?0;unsigned?int?ret;/*?將cr0寄存器的值移動到rax寄存器中,同時輸出到cr0變量中?*/asm?volatile?("movq?%%cr0,?%%rax"?:?"=a"(cr0));ret?=?cr0;cr0?&=?0xfffeffff;??/*?將cr0變量值中的第16位清0,將修改后的值寫入cr0寄存器?*//*?讀取cr0的值到rax寄存器,再將rax寄存器的值放入cr0中?*/asm?volatile?("movq?%%rax,?%%cr0"?::?"a"(cr0));return?ret; }/**?還原cr0寄存器的值為val*/ void?setback_cr0(unsigned?int?val) {asm?volatile?("movq?%%rax,?%%cr0"?::?"a"(val)); }第二種方法:設置虛擬地址對應頁表項的讀寫屬性
由于?x86 CPU?的內存保護機制是通過虛擬內存頁表來實現的(可以參考這篇文章:漫談內存映射),所以我們只需要把?sys_call_table?數組的虛擬內存頁表項中的保護標志位清空即可,代碼如下:
/**?把虛擬內存地址設置為可寫*/ int?make_rw(unsigned?long?address) {unsigned?int?level;//查找虛擬地址所在的頁表地址pte_t?*pte?=?lookup_address(address,?&level);if?(pte->pte?&?~_PAGE_RW)??//設置頁表讀寫屬性pte->pte?|=??_PAGE_RW;return?0; }/**?把虛擬內存地址設置為只讀*/ int?make_ro(unsigned?long?address) {unsigned?int?level;pte_t?*pte?=?lookup_address(address,?&level);pte->pte?&=?~_PAGE_RW;??//設置只讀屬性return?0; }3. 修改?sys_call_table?數組的內容
萬事俱備,只欠東風。前面我們把準備工作都做完了,現在只需要把?sys_call_table?數組中的系統(tǒng)調用入口替換成我們編寫的函數入口即可。
我們可以在內核模塊初始化函數修改?sys_call_table?數組的值,然后在內核模塊退出函數改回成原來的值即可,完整代碼如下:
/**?File:?syscall.c*/#include?<linux/module.h> #include?<linux/kernel.h> #include?<linux/init.h> #include?<linux/unistd.h> #include?<linux/time.h> #include?<asm/uaccess.h> #include?<linux/sched.h> #include?<linux/kallsyms.h>unsigned?long?*sys_call_table;unsigned?int?clear_and_return_cr0(void); void?setback_cr0(unsigned?int?val); static?int?sys_hackcall(void);unsigned?long?*sys_call_table?=?0;/*?定義一個函數指針,用來保存原來的系統(tǒng)調用*/ static?int?(*orig_syscall_saved)(void);/**?設置cr0寄存器的第16位為0*/ unsigned?int?clear_and_return_cr0(void) {unsigned?int?cr0?=?0;unsigned?int?ret;/*?將cr0寄存器的值移動到rax寄存器中,同時輸出到cr0變量中?*/asm?volatile?("movq?%%cr0,?%%rax"?:?"=a"(cr0));ret?=?cr0;cr0?&=?0xfffeffff;??/*?將cr0變量值中的第16位清0,將修改后的值寫入cr0寄存器?*//*?讀取cr0的值到rax寄存器,再將rax寄存器的值放入cr0中?*/asm?volatile?("movq?%%rax,?%%cr0"?::?"a"(cr0));return?ret; }/**?還原cr0寄存器的值為val*/ void?setback_cr0(unsigned?int?val) {asm?volatile?("movq?%%rax,?%%cr0"?::?"a"(val)); }/**?自己編寫的系統(tǒng)調用函數*/ static?int?sys_hackcall(void) {printk("Hack?syscall?is?successful!!!\n");return?0; }/**?模塊的初始化函數,模塊的入口函數,加載模塊時調用*/ static?int?__init?init_hack_module(void) {int?orig_cr0;printk("Hack?syscall?is?starting...\n");/*?獲取?sys_call_table?虛擬內存地址?*/sys_call_table?=?(unsigned?long?*)kallsyms_lookup_name("sys_call_table");/*?保存原始系統(tǒng)調用?*/orig_syscall_saved?=?(int(*)(void))(sys_call_table[__NR_perf_event_open]);orig_cr0?=?clear_and_return_cr0();?/*?設置cr0寄存器的第16位為0?*/sys_call_table[__NR_perf_event_open]?=?(unsigned?long)&sys_hackcall;?/*?替換成我們編寫的函數?*/setback_cr0(orig_cr0);?/*?還原cr0寄存器的值?*/return?0; }/**?模塊退出函數,卸載模塊時調用*/ static?void?__exit?exit_hack_module(void) {int?orig_cr0;orig_cr0?=?clear_and_return_cr0();sys_call_table[__NR_perf_event_open]?=?(unsigned?long)orig_syscall_saved;?/*?設置為原來的系統(tǒng)調用?*/setback_cr0(orig_cr0);printk("Hack?syscall?is?exited....\n"); }module_init(init_hack_module); module_exit(exit_hack_module); MODULE_LICENSE("GPL");在上面代碼中,我們將?perf_event_open()?系統(tǒng)調用替換成了我們自己實現的函數。
注意:測試時最好使用冷門的系統(tǒng)調用,否則可能會導致系統(tǒng)崩潰。
4. 編寫 Makefile 文件
為了編譯方便,我們編寫一個 Makefile 文件來進行編譯,如下所示:
obj-m:=syscall.o PWD:=?$(shell?pwd) KERNELDIR:=?/lib/modules/$(shell?uname?-r)/build EXTRA_CFLAGS=?-O0all:make?-C?$(KERNELDIR)??M=$(PWD)?modules clean:make?-C?$(KERNELDIR)?M=$(PWD)?clean要注意添加?EXTRA_CFLAGS= -O0?關閉 gcc 優(yōu)化選項,避免插入模塊出錯。
5. 測試程序
現在,我們編寫一個測試程序來測試一下系統(tǒng)調用攔截是否成功,代碼如下:
#include?<syscall.h> #include?<stdio.h> #include?<unistd.h>int?main(void) {unsigned?long?ret?=?syscall(__NR_perf_event_open,?NULL,?0,?0,?0,?0);printf("%d\n",?(int)ret);return?0; }6. 運行結果
第一步:安裝攔截內核模塊
使用以下命令安裝內核模塊:
root# insmod syscall.ko然后通過?dmesg?命令來觀察系統(tǒng)日志,可以看到以下輸出:
... [ 133.564652] Hack syscall is starting...這說明我們的內核模塊安裝成功。
第二步:運行測試程序
接著,我們運行剛才編寫的測試程序,然后觀察系統(tǒng)日志,輸出如下:
... [ 532.243714] Hack syscall is successful!!!這說明攔截系統(tǒng)調用成功了。
- END -
看完一鍵三連在看,轉發(fā),點贊
是對文章最大的贊賞,極客重生感謝你
推薦閱讀
大廠后臺開發(fā)基本功修煉路線和經典資料
2022新年重磅技術分享|深入理解Linux操作系統(tǒng)
你好,這里是極客重生,我是阿榮,大家都叫我榮哥,從華為->外企->到互聯網大廠,目前是大廠資深工程師,多次獲得五星員工,多年職場經驗,技術扎實,專業(yè)后端開發(fā)和后臺架構設計,熱愛底層技術,豐富的實戰(zhàn)經驗,分享技術的本質原理,希望幫助更多人蛻變重生,拿BAT大廠offer,培養(yǎng)高級工程師能力,成為技術專家,實現高薪夢想,期待你的關注!點擊藍字查看我的成長之路。
校招/社招/簡歷/面試技巧/大廠技術棧分析/后端開發(fā)進階/優(yōu)秀開源項目/直播分享/技術視野/實戰(zhàn)高手等,?極客星球希望成為最有技術價值星球,盡最大努力為星球的同學提供技術和成長幫助!詳情查看->極客星球
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 求點贊,在看,分享三連
總結
以上是生活随笔為你收集整理的手把手教你拦截Linux系统调用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度思考|TCP协议存在那些缺陷?
- 下一篇: Linux性能优化全景指南