日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > linux >内容正文

linux

Linux系统调用的运行过程【转】

發(fā)布時間:2025/3/19 linux 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Linux系统调用的运行过程【转】 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文轉(zhuǎn)自:http://blog.csdn.net/kernel_learner/article/details/7331505

在Linux中,系統(tǒng)調(diào)用是用戶空間訪問內(nèi)核的唯一手段,它們是內(nèi)核唯一的合法入口。

?????? 一般情況下,應(yīng)用程序通過應(yīng)用編程接口(API)而不是直接通過系統(tǒng)調(diào)用來編程,而且這種編程接口實際上并不需要和內(nèi)核提供的系統(tǒng)調(diào)用對應(yīng)。一個API定義了一組應(yīng)用程序使用的編程接口。它們可以實現(xiàn)成一個系統(tǒng)調(diào)用,也可以通過調(diào)用多個系統(tǒng)調(diào)用來實現(xiàn),即使不使用任何系統(tǒng)調(diào)用也不存在問題。實際上,API可以在各種不同的操作系統(tǒng)上實現(xiàn),給應(yīng)用程序提供完全相同的接口,而它們本身在這些系統(tǒng)上的實現(xiàn)卻可能迥異。

?????? 在Unix世界中,最流行的應(yīng)用編程接口是基于POSIX標(biāo)準(zhǔn)的,Linux是與POSIX兼容的。

?????? 從程序員的角度看,他們只需要給API打交道就可以了,而內(nèi)核只跟系統(tǒng)調(diào)用打交道;庫函數(shù)及應(yīng)用程序是怎么使用系統(tǒng)調(diào)用不是內(nèi)核關(guān)心的。

?????? 系統(tǒng)調(diào)用(在linux中常稱作syscalls)通常通過函數(shù)進(jìn)行調(diào)用。它們通常都需要定義一個或幾個參數(shù)(輸入)而且可能產(chǎn)生一些副作用。這些副作用通過一個long類型的返回值來表示成功(0值)或者錯誤(負(fù)值)。在系統(tǒng)調(diào)用出現(xiàn)錯誤的時候會把錯誤碼寫入errno全局變量。通過調(diào)用perror()函數(shù),可以把該變量翻譯成用戶可以理解的錯誤字符串。

?????? 系統(tǒng)調(diào)用的實現(xiàn)有兩個特別之處:

?????? 1)函數(shù)聲明中都有asmlinkage限定詞,用于通知編譯器僅從棧中提取該函數(shù)的參數(shù)。

?????? 2)系統(tǒng)調(diào)用getXXX()在內(nèi)核中被定義為sys_getXXX()。這是Linux中所有系統(tǒng)調(diào)用都應(yīng)該遵守的命名規(guī)則。

?????? 系統(tǒng)調(diào)用號:在linux中,每個系統(tǒng)調(diào)用都賦予一個系統(tǒng)調(diào)用號,通過這個獨一無二的號就可以關(guān)聯(lián)系統(tǒng)調(diào)用。當(dāng)用戶空間的進(jìn)程執(zhí)行一個系統(tǒng)調(diào)用的時候,這個系統(tǒng)調(diào)用號就被用來指明到底要執(zhí)行哪個系統(tǒng)調(diào)用;進(jìn)程不會提及系統(tǒng)調(diào)用的名稱。系統(tǒng)調(diào)用號一旦分配就不能再有任何變更(否則編譯好的應(yīng)用程序就會崩潰),如果一個系統(tǒng)調(diào)用被刪除,它所占用的系統(tǒng)調(diào)用號也不允許被回收利用。Linux有一個"未使用"系統(tǒng)調(diào)用sys_ni_syscall(),它除了返回-ENOSYS外不做任何其他工作,這個錯誤號就是專門針對無效的系統(tǒng)調(diào)用而設(shè)的。雖然很罕見,但如果有一個系統(tǒng)調(diào)用被刪除,這個函數(shù)就要負(fù)責(zé)“填補(bǔ)空位”。

?????? 內(nèi)核記錄了系統(tǒng)調(diào)用表中所有已注冊過的系統(tǒng)調(diào)用的列表,存儲在sys_call_table中。它與體系結(jié)構(gòu)有關(guān),一般在entry.s中定義。這個表中為每一個有效的系統(tǒng)調(diào)用指定了唯一的系統(tǒng)調(diào)用號。

?????? 用戶空間的程序無法直接執(zhí)行內(nèi)核代碼。它們不能直接調(diào)用內(nèi)核空間的函數(shù),因為內(nèi)核駐留在受保護(hù)的地址空間上,應(yīng)用程序應(yīng)該以某種方式通知系統(tǒng),告訴內(nèi)核自己需要執(zhí)行一個系統(tǒng)調(diào)用,系統(tǒng)系統(tǒng)切換到內(nèi)核態(tài),這樣內(nèi)核就可以代表應(yīng)用程序來執(zhí)行該系統(tǒng)調(diào)用了。這種通知內(nèi)核的機(jī)制是通過軟中斷實現(xiàn)的。x86系統(tǒng)上的軟中斷由int$0x80指令產(chǎn)生。這條指令會觸發(fā)一個異常導(dǎo)致系統(tǒng)切換到內(nèi)核態(tài)并執(zhí)行第128號異常處理程序,而該程序正是系統(tǒng)調(diào)用處理程序,名字叫system_call().它與硬件體系結(jié)構(gòu)緊密相關(guān),通常在entry.s文件中通過匯編語言編寫。

?????? 所有的系統(tǒng)調(diào)用陷入內(nèi)核的方式都是一樣的,所以僅僅是陷入內(nèi)核空間是不夠的。因此必須把系統(tǒng)調(diào)用號一并傳給內(nèi)核。在x86上,這個傳遞動作是通過在觸發(fā)軟中斷前把調(diào)用號裝入eax寄存器實現(xiàn)的。這樣系統(tǒng)調(diào)用處理程序一旦運行,就可以從eax中得到數(shù)據(jù)。上述所說的system_call()通過將給定的系統(tǒng)調(diào)用號與NR_syscalls做比較來檢查其有效性。如果它大于或者等于NR_syscalls,該函數(shù)就返回-ENOSYS.否則,就執(zhí)行相應(yīng)的系統(tǒng)調(diào)用:call *sys_call_table(, %eax, 4);

?????? 由于系統(tǒng)調(diào)用表中的表項是以32位(4字節(jié))類型存放的,所以內(nèi)核需要將給定的系統(tǒng)調(diào)用號乘以4,然后用所得到的結(jié)果在該表中查詢器位置。如圖圖一所示:

???????????????????????????????????????

?????上面已經(jīng)提到,除了系統(tǒng)調(diào)用號以外,還需要一些外部的參數(shù)輸入。最簡單的辦法就是像傳遞系統(tǒng)調(diào)用號一樣把這些參數(shù)也存放在寄存器里。在x86系統(tǒng)上ebx,ecx,edx,esi和edi按照順序存放前5個參數(shù)。需要六個或六個以上參數(shù)的情況不多見,此時,應(yīng)該用一個單獨的寄存器存放指向所有這些參數(shù)在用戶空間地址的指針。給用戶空間的返回值也通過寄存器傳遞。在x86系統(tǒng)上,它存放在eax寄存器中。

?????? 系統(tǒng)調(diào)用必須仔細(xì)檢查它們所有的參數(shù)是否合法有效。系統(tǒng)調(diào)用在內(nèi)核空間執(zhí)行。如果任由用戶將不合法的輸入傳遞給內(nèi)核,那么系統(tǒng)的安全和穩(wěn)定將面臨極大的考驗。最重要的一種檢查就是檢查用戶提供的指針是否有效,內(nèi)核在接收一個用戶空間的指針之前,內(nèi)核必須要保證:

1)指針指向的內(nèi)存區(qū)域?qū)儆谟脩艨臻g
2)指針指向的內(nèi)存區(qū)域在進(jìn)程的地址空間里
3)如果是讀,讀內(nèi)存應(yīng)該標(biāo)記為可讀。如果是寫,該內(nèi)存應(yīng)該標(biāo)記為可寫。

?????? 內(nèi)核提供了兩種方法來完成必須的檢查和內(nèi)核空間與用戶空間之間數(shù)據(jù)的來回拷貝。這兩個方法必須有一個被調(diào)用。

copy_to_user():向用戶空間寫入數(shù)據(jù),需要3個參數(shù)。第一個參數(shù)是進(jìn)程空間中的目的內(nèi)存地址。第二個是內(nèi)核空間內(nèi)的源地址。第三個是需要拷貝的數(shù)據(jù)長度(字節(jié)數(shù))。
copy_from_user():向用戶空間讀取數(shù)據(jù),需要3個參數(shù)。第一個參數(shù)是進(jìn)程空間中的目的內(nèi)存地址。第二個是內(nèi)核空間內(nèi)的源地址.第三個是需要拷貝的數(shù)據(jù)長度(字節(jié)數(shù))。
注意:這兩個都有可能引起阻塞。當(dāng)包含用戶數(shù)據(jù)的頁被換出到硬盤上而不是在物理內(nèi)存上的時候,這種情況就會發(fā)生。此時,進(jìn)程就會休眠,直到缺頁處理程序?qū)⒃擁搹挠脖P重新?lián)Q回到物理內(nèi)存。

?????? 內(nèi)核在執(zhí)行系統(tǒng)調(diào)用的時候處于進(jìn)程上下文,current指針指向當(dāng)前任務(wù),即引發(fā)系統(tǒng)調(diào)用的那個進(jìn)程。在進(jìn)程上下文中,內(nèi)核可以休眠(比如在系統(tǒng)調(diào)用阻塞或顯式調(diào)用schedule()的時候)并且可以被搶占。當(dāng)系統(tǒng)調(diào)用返回的時候,控制權(quán)仍然在system_call()中,它最終會負(fù)責(zé)切換到用戶空間并讓用戶進(jìn)程繼續(xù)執(zhí)行下去。

?????? 給linux添加一個系統(tǒng)調(diào)用時間很簡單的事情,怎么設(shè)計和實現(xiàn)一個系統(tǒng)調(diào)用是難題所在。實現(xiàn)系統(tǒng)調(diào)用的第一步是決定它的用途,這個用途是明確且唯一的,不要嘗試編寫多用途的系統(tǒng)調(diào)用。ioctl則是一個反面教材。新系統(tǒng)調(diào)用的參數(shù),返回值和錯誤碼該是什么,這些都很關(guān)鍵。一旦一個系統(tǒng)調(diào)用編寫完成后,把它注冊成為一個正式的系統(tǒng)調(diào)用是件瑣碎的工作,一般下面幾步:

1)在系統(tǒng)調(diào)用表(一般位于entry.s)的最后加入一個表項。從0開始算起,系統(tǒng)表項在該表中的位置就是它的系統(tǒng)調(diào)用號。如第10個系統(tǒng)調(diào)用分配到系統(tǒng)調(diào)用號為9。
2)任何體系結(jié)構(gòu),系統(tǒng)調(diào)用號都必須定義于include/asm/unistd.h中
3)系統(tǒng)調(diào)用必須被編譯進(jìn)內(nèi)核映像(不能編譯成模塊)。這只要把它放進(jìn)kernel/下的一個相關(guān)文件就可以。

??????

??????? 用戶的程序無法直接執(zhí)行內(nèi)核代碼。他們不能直接調(diào)用內(nèi)核的函數(shù),因為內(nèi)核駐留在受保護(hù)的地址空間。所以應(yīng)用程序應(yīng)該通過某種方式通知內(nèi)核,告訴內(nèi)核自己需要執(zhí)行一個系統(tǒng)調(diào)用,希望系統(tǒng)切換到內(nèi)核態(tài),這樣內(nèi)核就可以代表應(yīng)用程序來執(zhí)行該系統(tǒng)調(diào)用了。

?????? 通知內(nèi)核的機(jī)制是通過軟中斷的機(jī)制實現(xiàn)的:通過引發(fā)一個異常來促使系統(tǒng)切換到內(nèi)核態(tài)去執(zhí)行異常處理程序。此時的異常處理程序?qū)嶋H上就是系統(tǒng)調(diào)用處理程序。

?????? 通常,系統(tǒng)調(diào)用靠C庫支持,用戶程序通過包含標(biāo)準(zhǔn)頭文件并和C庫鏈接,就可以使用系統(tǒng)調(diào)用(或者使用庫函數(shù),再由庫函數(shù)實際調(diào)用)。慶幸的是linux本身提供了一組宏用于直接對系統(tǒng)調(diào)用進(jìn)行訪問。它會設(shè)置好寄存器并調(diào)用int $0x80指令。這些宏是_syscalln(),其中n的范圍是從0到6.代表需要傳遞給系統(tǒng)調(diào)用的參數(shù)個數(shù)。這是由于該宏必須了解到底有多少參數(shù)按照什么次序壓入寄存器。以open系統(tǒng)調(diào)用為例:

open()系統(tǒng)調(diào)用定義如下是:
long open(const char *filename, int flags, int mode)
直接調(diào)用此系統(tǒng)調(diào)用的宏的形式為:
#define NR_open 5
_syscall3(long, open, const char *, filename, int , flags, int, mode)

????這樣,應(yīng)用程序就可以直接使用open().調(diào)用open()系統(tǒng)調(diào)用直接把上面的宏放置在應(yīng)用程序中就可以了。對于每個宏來說,都有2+2*n個參數(shù)。每個參數(shù)的意義簡單明了,這里就不詳細(xì)說明了。












本文轉(zhuǎn)自張昺華-sky博客園博客,原文鏈接:http://www.cnblogs.com/sky-heaven/p/4508065.html,如需轉(zhuǎn)載請自行聯(lián)系原作者

與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖

總結(jié)

以上是生活随笔為你收集整理的Linux系统调用的运行过程【转】的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 黄色a免费| 久久在线观看 | 小早川怜子久久精品中文字幕 | 一边摸上面一边摸下面 | 免费看欧美黑人毛片 | 先锋资源av | 波多野结衣在线观看一区二区 | 精品视频91| 色欲一区二区三区精品a片 在线观看黄网站 | 好吊视频一二三区 | 污污的视频在线观看 | 五月婷婷六月婷婷 | 日本午夜精品理论片a级app发布 | 可以免费观看的毛片 | 男人的天堂手机在线 | 国产夫妻性爱视频 | 久久女| 青青草国产一区二区三区 | 国产成人精品aa毛片 | 中文字幕乱码亚洲无线三区 | 欧美激情免费视频 | 亚洲精品一区二三区 | 大奶毛片| 亚洲v欧美v另类v综合v日韩v | √资源天堂中文在线 | 性感美女被草 | 911精品国产一区二区在线 | www.777含羞草 | 99精品视频在线免费观看 | 伊久久 | 国产一区二区99 | 制服丝袜av一区二区三区下载 | 36d大奶 | 日本三级日本三级日本三级极 | 久久九九热视频 | 日本乱淫视频 | 国产精品毛片一区二区在线看 | 美国做爰xxxⅹ性视频 | 69pao| 亚洲一区在线免费观看 | 一区在线免费 | 男人插女人下面视频 | 日韩一级片免费 | 色哟哟视频网站 | 88av在线| 国产日韩欧美一区二区东京热 | 九九黄色片 | 三级黄色免费 | 国产精品久久久久久久久久直播 | 我们俩电影网mp4动漫官网 | 国产又粗又猛又爽又黄91 | 国产无遮挡又黄又爽在线观看 | 女人天堂网| 亚洲无线视频 | 精品国产av 无码一区二区三区 | 国产乱论视频 | 欧美网站在线 | 久久久久亚洲av无码专区 | 国产一二 | 欧美激情免费看 | 日本涩涩视频 | 青青草手机视频 | 日韩视频在线播放 | 狠狠干夜夜爽 | 精品国产三级片在线观看 | 91玉足脚交嫩脚丫在线播放 | 水蜜桃av无码 | 91福利网站 | 强行侵犯视频在线观看 | 国产区一区二区三区 | 94av| 欧美精品一区二区三区四区五区 | 亚洲最新在线观看 | 午夜av免费 | 夜夜操天天爽 | 思思久久久 | 97超碰免费观看 | 欧美人妻日韩精品 | 羞羞动态图 | av网站免费在线观看 | 山外人精品影院 | 国产精品成人va在线观看 | 夜夜嗨老熟女av一区二区三区 | 女同另类之国产女同 | 欧美日皮视频 | 公交顶臀绿裙妇女配视频 | 日韩美av| 午夜手机福利 | 男女野外做受全过程 | 热热色av | 免费中文字幕日韩欧美 | 免费色片网站 | 中文字幕免费 | 久久久久久久久久久久国产 | 日韩美女视频网站 | 精品一区二区三区免费 | 青青草久久久 | 你懂的视频在线播放 | 美女涩涩视频 |