转载:谢谢原作者:块设备驱动实战基础篇一 (170行代码构建一个逻辑块设备驱动)
1?? 內(nèi)核塊設(shè)備驅(qū)動(dòng)基礎(chǔ)學(xué)習(xí)與實(shí)戰(zhàn)
1.1 設(shè)備驅(qū)動(dòng)IO架構(gòu)初探
?
操作系統(tǒng)是如何將數(shù)據(jù)讀到緩沖區(qū)的,發(fā)生了什么?我們帶著這樣的問(wèn)題,粗略走一下read調(diào)用系統(tǒng)過(guò)程,希望這個(gè)初探,可以喚起大家研究操作系統(tǒng)內(nèi)核的好奇心和興趣,并以此為例,讓我們先初步對(duì)請(qǐng)求在過(guò)濾塊設(shè)備驅(qū)動(dòng)中的處理過(guò)程有個(gè)大概印象和了解。
?
塊設(shè)備在整個(gè)Linux中應(yīng)用的總體結(jié)構(gòu)圖如下:
?
從上圖可以看出,塊設(shè)備的應(yīng)用在Linux中是一個(gè)完整的子系統(tǒng)。?最上面是虛擬文件系統(tǒng)層,其作用是屏蔽下層具體文件系統(tǒng)操作的差異,為上層的操作提供一個(gè)統(tǒng)一的接口。有了這個(gè)層次,可以把設(shè)備抽象成文件,使得操作設(shè)備就像操作文件一樣簡(jiǎn)單。在具體的文件系統(tǒng)層中,不同的文件系統(tǒng)(例如 ext2 和 NTFS)具體的操作過(guò)程也是不同的,每種文件系統(tǒng)定義了自己的操作集合。引入 cache 層的目的是為了提高 linux 操作系統(tǒng)對(duì)磁盤訪問(wèn)的性能,cache 層在內(nèi)存中緩存了磁盤上的部分?jǐn)?shù)據(jù),當(dāng)數(shù)據(jù)的請(qǐng)求到達(dá)時(shí),如果在 cache 中存在該數(shù)據(jù)且是最新的,則直接將數(shù)據(jù)傳遞給用戶程序,免除了對(duì)底層磁盤的操作,提高了性能。
接下來(lái)是通用塊層,其主要工作是:接收上層發(fā)出的磁盤請(qǐng)求,并最終發(fā)出 IO 請(qǐng)求。該層隱藏了底層硬件塊設(shè)備的特性,為塊設(shè)備提供了一個(gè)通用的抽象視圖。然后下面是IO 調(diào)度層,其功能是接收通用塊層發(fā)出的 IO 請(qǐng)求,緩存請(qǐng)求并試圖合并相鄰的請(qǐng)求(如果這兩個(gè)請(qǐng)求的數(shù)據(jù)在磁盤上是相鄰的)。根據(jù)設(shè)置好的調(diào)度算法,回調(diào)驅(qū)動(dòng)層提供的請(qǐng)求處理函數(shù),來(lái)處理具體的 IO 請(qǐng)求。驅(qū)動(dòng)層中的驅(qū)動(dòng)程序?qū)?yīng)具體的物理塊設(shè)備,它從上層中取出 IO 請(qǐng)求,并根據(jù)該 IO 請(qǐng)求中指定的信息,通過(guò)向具體塊設(shè)備的設(shè)備控制器發(fā)送命令的方式,來(lái)操縱設(shè)備傳輸數(shù)據(jù)。
?
?
大家都寫過(guò)read讀文件的數(shù)據(jù),你想知道或者探秘read到底是如何把數(shù)據(jù)讀上來(lái)的嗎,操作系統(tǒng)是如何處理的,linux是如何處理的,從現(xiàn)在開始讓我們逐漸養(yǎng)成尋根究底的學(xué)習(xí)方法,能夠主動(dòng)思考或者探秘操作系統(tǒng)行為,這樣才能逐漸理解操作系統(tǒng)的工作原理,逐漸理解linux內(nèi)核的設(shè)計(jì)藝術(shù)和實(shí)現(xiàn)原理,也才能夠逐漸往高手的水平上邁進(jìn)。讓我們分析一下一個(gè)讀請(qǐng)求從應(yīng)用層到內(nèi)核層的全過(guò)程,來(lái)分析read系統(tǒng)調(diào)用的真正工作原理,也充分理解一下請(qǐng)求是如何走到塊設(shè)備驅(qū)動(dòng)層,然后塊設(shè)備做了哪些處理把請(qǐng)求最終提交到磁盤完成數(shù)據(jù)請(qǐng)求的,這樣就為塊設(shè)備學(xué)習(xí)開啟了入門之路。
?
?
關(guān)鍵路徑點(diǎn)初探:
?
?? 從應(yīng)用層開始調(diào)用glibc庫(kù)的read函數(shù),經(jīng)過(guò)glibc庫(kù)的處理,最終通過(guò)操作系統(tǒng)內(nèi)核提供的sys_read函數(shù)系統(tǒng)調(diào)用進(jìn)入內(nèi)核。[再回頭看看第一章中的內(nèi)核系統(tǒng)架構(gòu)圖,內(nèi)核klib庫(kù)中系統(tǒng)調(diào)用是內(nèi)核一個(gè)機(jī)制,系統(tǒng)調(diào)用中發(fā)生了什么事,cpu相關(guān)關(guān)鍵寄存器做了什么切換,我們現(xiàn)在先提出來(lái),先不具體講解,繼續(xù)我們的主線初探過(guò)程]
?? 進(jìn)入內(nèi)核sys_read函數(shù)處理,我們進(jìn)入了內(nèi)核IO路徑上的第一個(gè)模塊層VFS虛擬文件系統(tǒng)層,首先根據(jù)sys_read函數(shù)中指定的文件描述符和要訪問(wèn)的文件數(shù)據(jù)起始地址,去內(nèi)存上找一找,是否內(nèi)存中已經(jīng)緩存了我們要讀取的文件數(shù)據(jù),如果有,直接從內(nèi)存拷貝一份到我們申請(qǐng)的buffer中即可,在這里我們知道了一個(gè)很關(guān)鍵的操作系統(tǒng)知識(shí)點(diǎn),應(yīng)用read函數(shù)提供的buffer 與? 內(nèi)核內(nèi)存緩存是不一樣的,內(nèi)核中管理的內(nèi)存數(shù)據(jù)需要拷貝給用戶空間的buffer才可以,用戶空間的程序是不能直接訪問(wèn)和使用內(nèi)核中的緩存數(shù)據(jù)的;如果沒(méi)有緩存數(shù)據(jù),則sys_read會(huì)繼續(xù)往下走,首先VFS會(huì)為我們要讀取的文件數(shù)據(jù)單獨(dú)申請(qǐng)一下內(nèi)核內(nèi)存空間,這個(gè)內(nèi)存空間是后續(xù)從磁盤真正把數(shù)據(jù)讀上來(lái)時(shí)要存放的地方,我們不能直接往用戶空間read函數(shù)提供的buffer中存放數(shù)據(jù),這是linux內(nèi)核架構(gòu)機(jī)制決定的,我們先記住這是一個(gè)約定,是否感覺(jué)內(nèi)核好麻煩,已經(jīng)有內(nèi)存buffer了還要申請(qǐng)內(nèi)存,這樣的事情后續(xù)還有很多,我們通過(guò)課程的逐漸加深會(huì)一一為大家解答,但是現(xiàn)在先不要過(guò)于心急,繼續(xù)我們的初探之路;
?? VFS為其分配了緩存后,sys_read便從VFS 層進(jìn)入到了具體文件系統(tǒng)層的IO代碼處理中,為啥要進(jìn)入具體文件系統(tǒng),因?yàn)橹挥形募到y(tǒng)才知道文件數(shù)據(jù)在磁盤的真正位置,所以既然接下來(lái)要從磁盤上獲取數(shù)據(jù)了,那一定要通過(guò)具體文件系統(tǒng)知道文件數(shù)據(jù)的真實(shí)磁盤位置,我們從read函數(shù)的接口輸入?yún)?shù)上也可以看出,我們并沒(méi)有指定我們從磁盤那個(gè)位置進(jìn)行讀取;
?? 具體文件系統(tǒng)轉(zhuǎn)換請(qǐng)求地址后,會(huì)構(gòu)造塊設(shè)備請(qǐng)求(bio),我們由此接觸到了過(guò)濾塊設(shè)備驅(qū)動(dòng)第一個(gè)最核心的數(shù)據(jù)結(jié)構(gòu) -塊設(shè)備請(qǐng)求描述數(shù)據(jù)結(jié)構(gòu)bio,就是block device input/output的縮寫。文件系統(tǒng)會(huì)把bio提交給過(guò)濾塊設(shè)備驅(qū)動(dòng)。
?? 過(guò)濾塊設(shè)備驅(qū)動(dòng)收到請(qǐng)求后,會(huì)繼續(xù)轉(zhuǎn)發(fā)給底層真實(shí)的硬件磁盤驅(qū)動(dòng),進(jìn)而由其進(jìn)行數(shù)據(jù)讀取操作。
?
整個(gè)過(guò)程的初探之路結(jié)束了,這里面沒(méi)有涉及代碼的細(xì)節(jié),只是通過(guò)初探讓大家先整體上粗略的走一下真實(shí)的操作系統(tǒng)內(nèi)核處理請(qǐng)求的過(guò)程,接下來(lái)讓我們趕緊開始實(shí)戰(zhàn)吧,真正的挑戰(zhàn)要開始了。
1.2 快捷實(shí)戰(zhàn)170行代碼邏輯塊設(shè)備驅(qū)動(dòng)
經(jīng)過(guò)第一節(jié)一個(gè)簡(jiǎn)單的I/O路徑的數(shù)據(jù)流動(dòng)介紹,現(xiàn)在讓我們開始真正的進(jìn)入邏輯塊設(shè)備驅(qū)動(dòng)的學(xué)習(xí),因?yàn)閘inux內(nèi)核中的關(guān)鍵模塊和術(shù)語(yǔ)太多了,較為抽象,但是理解和掌握后,相信大家一定會(huì)感覺(jué)事情就是這么簡(jiǎn)單,也就會(huì)覺(jué)得為什么要把它描述的那么復(fù)雜和抽象,不就是那么回事嗎,所以我們首先先給I/O 路徑上的各個(gè)模塊簡(jiǎn)單打個(gè)比方,用一個(gè)較為形象的例子帶領(lǐng)大家腳踏實(shí)地,完成一個(gè)簡(jiǎn)單過(guò)濾塊設(shè)備驅(qū)動(dòng)模塊,進(jìn)而以此為基礎(chǔ),把操作系統(tǒng)/國(guó)內(nèi)外講解內(nèi)核的書中經(jīng)常提到的自旋鎖,信號(hào)量,進(jìn)程,內(nèi)存分配,工作隊(duì)列,實(shí)踐在我們的過(guò)濾塊設(shè)備驅(qū)動(dòng)模塊中,由此我們不僅可以在內(nèi)核里面開發(fā)了,同時(shí)我們開發(fā)的模塊在內(nèi)核中是多么的重要,同時(shí)通過(guò)我們開發(fā)的模塊還能快速把一些內(nèi)核機(jī)制/API使用上,一切是那么的自然,這就是我們的目標(biāo),我們不希望千篇一律再把龐大的內(nèi)核翻來(lái)覆去的抽象講解,我們就是要腳踏實(shí)地,踏踏實(shí)實(shí)的真正進(jìn)入內(nèi)核做開發(fā),通過(guò)過(guò)濾塊設(shè)備驅(qū)動(dòng)的編寫,會(huì)為我們成功打開內(nèi)核學(xué)習(xí)和實(shí)戰(zhàn)的窗口,從而為后續(xù)內(nèi)核分析及修煉之路打下堅(jiān)實(shí)的實(shí)戰(zhàn)技能基礎(chǔ)。
?
[小知識(shí):塊設(shè)備與字符設(shè)備]
系統(tǒng)中能夠隨機(jī)讀取(不需要按順序)訪問(wèn)固定大小數(shù)據(jù)片(chunk)的設(shè)備被稱作塊設(shè)備,這些數(shù)據(jù)片就稱作塊。最常見的塊設(shè)備是硬盤,除此之外,還有軟盤驅(qū)動(dòng)器、CD-ROM驅(qū)動(dòng)器和閃存等許多其他設(shè)備。它們都是以安裝文件系統(tǒng)的方式使用的——這也是塊設(shè)備通常的訪問(wèn)方式。塊設(shè)備分為物理塊設(shè)備(實(shí)際的磁盤)和邏輯塊設(shè)備(磁盤分區(qū),LVM等)。塊設(shè)備可以用來(lái)創(chuàng)建文件系統(tǒng)、加載卸載、存儲(chǔ)數(shù)據(jù),也可以用來(lái)創(chuàng)建分區(qū)。
Linux設(shè)備的每個(gè)設(shè)備都由唯一的一個(gè)設(shè)備號(hào)標(biāo)識(shí),設(shè)備號(hào)由主設(shè)備號(hào)和次設(shè)備號(hào)組成;主設(shè)備號(hào)標(biāo)識(shí)設(shè)備的類型及對(duì)應(yīng)的驅(qū)動(dòng)程序;次設(shè)備號(hào)對(duì)應(yīng)具體的設(shè)備。Linux系統(tǒng)負(fù)責(zé)管理全局設(shè)備號(hào),設(shè)備驅(qū)動(dòng)負(fù)責(zé)申請(qǐng)?jiān)O(shè)備號(hào)(可以通過(guò)ll /dev/xxx命令查看設(shè)備號(hào);cat/proc/devices可以查看系統(tǒng)中已使用的設(shè)備號(hào))。
?
與字符設(shè)備的區(qū)別:
字符設(shè)備按照字符流的方式被有序訪問(wèn),如串口和鍵盤就都屬于字符設(shè)備,如果一個(gè)硬件設(shè)備是以字符流的方式訪問(wèn)的話,那就應(yīng)該將它歸于字符設(shè)備,反過(guò)來(lái),如果一個(gè)設(shè)備是隨機(jī)(無(wú)序的)訪問(wèn)的,那么它就屬于塊設(shè)備。根本區(qū)別是它們能否可以被隨機(jī)訪問(wèn),也就是說(shuō),能否在訪問(wèn)設(shè)備時(shí)隨意的從一個(gè)位置跳轉(zhuǎn)到另一個(gè)位置。塊設(shè)備只能以塊為單位接受輸入和返回輸出,而字符設(shè)備以字節(jié)為單位,只能被順序讀寫。
?
我們?nèi)匀灰砸粋€(gè)讀請(qǐng)求的處理過(guò)程為例進(jìn)行,首先大家先看一個(gè)例子,最近X公司耗費(fèi)精力籌寫了一本巨著,書內(nèi)容非常龐大,該公司以512頁(yè)為單位,將這本書分開存放在一個(gè)秘密的存儲(chǔ)室里,由于這本書內(nèi)容太龐大,并且就只有一本,許多讀者想借閱,為了滿足大家的需要,X公司規(guī)定大家把每次需要借閱的書的頁(yè)碼起始數(shù)和頁(yè)數(shù)準(zhǔn)備好,公司會(huì)根據(jù)讀者的需要找到書后進(jìn)行復(fù)印,把復(fù)印件提供給讀者。
?
寫到這,大家應(yīng)該能夠明白X公司相當(dāng)于文件系統(tǒng),它知道讀者需要的頁(yè)碼對(duì)應(yīng)的內(nèi)容在存儲(chǔ)室的哪個(gè)位置存放,存儲(chǔ)室就相當(dāng)于我們的磁盤。Ok,我們繼續(xù)把這個(gè)事情打比喻,請(qǐng)大家繼續(xù)耐心。
?
X公司為了竭力保護(hù)好存儲(chǔ)室,他們把存儲(chǔ)室的位置放置在城市的郊區(qū),同時(shí)為了更好的服務(wù)讀者,他們?cè)谑袇^(qū)租用了一個(gè)小型的臨時(shí)存儲(chǔ)室,預(yù)先存放書籍的部分復(fù)印件,主要是考慮到大部分讀者都在市區(qū)工作,郊區(qū)太遠(yuǎn),不方便,如果臨時(shí)存儲(chǔ)室有讀者需要的書籍,則直接復(fù)印給讀者,如果沒(méi)有則去郊區(qū)的存儲(chǔ)室找到文件進(jìn)行復(fù)印。同時(shí)為了更加安全的考慮,X公司在市區(qū)和郊區(qū)之間構(gòu)建了三個(gè)虛擬的存儲(chǔ)室站點(diǎn)A,B,C,樣子看上去象是一個(gè)很大的實(shí)體存儲(chǔ)室,其實(shí)里面空空的,什么都沒(méi)有,只是個(gè)樣子而已,空間都是虛擬的,之所以這么做,是X公司想更好的保護(hù)圖書,以免出現(xiàn)安全問(wèn)題。這樣市區(qū)到郊區(qū)的路程就變?yōu)?#xff0c;市區(qū)->A站點(diǎn)->B站點(diǎn)->C站點(diǎn)->郊區(qū)。同時(shí)規(guī)定市區(qū)的人員只知道書存放在A站點(diǎn),A站點(diǎn)的人員會(huì)知道書其實(shí)存放在B站點(diǎn),B站點(diǎn)的人員其實(shí)只知道書存放在C站點(diǎn),而C站點(diǎn)才真正知道書存放在郊區(qū)的地點(diǎn)。
?
寫到這,大家又會(huì)進(jìn)一步明白,市區(qū)的臨時(shí)存儲(chǔ)室相當(dāng)于VFS緩存層,而A/B/C就是我們要給大家介紹的過(guò)濾塊設(shè)備驅(qū)動(dòng)模塊,大家可以看到過(guò)濾塊設(shè)備驅(qū)動(dòng)可以層疊很多,我們現(xiàn)在是三個(gè)過(guò)濾塊設(shè)備疊加。
?
?????? 我們繼續(xù)再定義幾個(gè)概念,讀者在市區(qū)借閱,如果市區(qū)的臨時(shí)存儲(chǔ)室沒(méi)有復(fù)印件,則X公司會(huì)準(zhǔn)備一個(gè)快遞包,這個(gè)快遞包就是個(gè)空盒子,里面什么也沒(méi)有,但是要注意空盒子雖然是空的,但是不是誰(shuí)都可以申請(qǐng)到的,空盒子有數(shù)量限制,如果申請(qǐng)?zhí)嗔?#xff0c;讀者就會(huì)被告知現(xiàn)在資源比較緊張,請(qǐng)稍等。好了,如果空盒子申請(qǐng)到了,那么是否就可以開始發(fā)送了,稍等,我們還要在盒子上做點(diǎn)標(biāo)記,起碼我們要寫上讀者要讀的書的頁(yè)碼和頁(yè)數(shù),當(dāng)然還有最重要的一個(gè)標(biāo)記就是這個(gè)空盒子的目的地,即這個(gè)盒子要發(fā)到A這個(gè)站點(diǎn),A站點(diǎn)收到盒子后,會(huì)繼續(xù)發(fā)給B,此時(shí)它要把盒子的目的地標(biāo)記修改為B, B收到后修改目的地,會(huì)繼續(xù)發(fā)給C, C會(huì)繼續(xù)發(fā)到X公司的郊區(qū)站點(diǎn)。
?
?????? 好了,以上提到的空盒子就是大名鼎鼎的BIO, 它就是描述一個(gè)請(qǐng)求的。當(dāng)這個(gè)請(qǐng)求也就是空盒子被發(fā)到郊區(qū)站點(diǎn)時(shí),注意此時(shí)還有一道關(guān)卡,這到關(guān)卡準(zhǔn)備了一些大箱子,內(nèi)容頁(yè)碼連續(xù)的空盒子被放在同樣的大箱子中,關(guān)卡會(huì)暫時(shí)緩存一下這些大箱子,等空盒子差不多積攢的夠多了,然后統(tǒng)一送到最終的存儲(chǔ)室,最后書籍會(huì)按照需求復(fù)印出來(lái)。上面的大箱子就是request, 而關(guān)卡就是request_queue請(qǐng)求隊(duì)列。
?
此時(shí)我們?cè)俳榻B三個(gè)概念:gendisk,hd_struct和block_device, 不管是臨時(shí)站點(diǎn)A/B/C, 還是郊區(qū)的存儲(chǔ)點(diǎn),都會(huì)對(duì)應(yīng)一個(gè)gendisk描述結(jié)構(gòu),該結(jié)構(gòu)描述了臨時(shí)站點(diǎn)或者存儲(chǔ)點(diǎn)的門牌號(hào)(major,minor號(hào)碼),存儲(chǔ)容量大小等信息,雖然A/B/C都是虛擬的站點(diǎn),但是也被寫上了一個(gè)虛擬容量,讓大家看上去象那么回事,感覺(jué)就是一個(gè)真實(shí)的物理磁盤塊設(shè)備。然后是hd_struct,大家都知道對(duì)磁盤進(jìn)行分區(qū),一個(gè)分區(qū)就會(huì)用一個(gè)hd_struct結(jié)構(gòu)進(jìn)行描述,記錄分區(qū)的大小,起始位置等信息。最后至于block_device結(jié)構(gòu),這個(gè)結(jié)構(gòu)其實(shí)也是描述設(shè)備信息的,同時(shí)它也要描述文件系統(tǒng)相關(guān)的部分信息,具體的我們現(xiàn)在先不介紹,我們?nèi)匀灰詳?shù)據(jù)流動(dòng)的過(guò)程為主,暫時(shí)先不跟進(jìn)具體的細(xì)節(jié)信息,我們只要明確一件事情,一個(gè)gendisk會(huì)對(duì)應(yīng)的一個(gè)block_device,? 如果gendisk有分區(qū),則每個(gè)分區(qū)hd_struct也會(huì)對(duì)應(yīng)一個(gè)block_device。
?
至此我們介紹了六個(gè)主要的數(shù)據(jù)結(jié)構(gòu),下面讓我們繼續(xù)描述如何構(gòu)建塊設(shè)備過(guò)濾驅(qū)動(dòng)。還是接著借書的例子,A/B/C要建立虛擬倉(cāng)庫(kù),首先我們要向操作系統(tǒng)申請(qǐng)注冊(cè)并申請(qǐng)門牌號(hào),這個(gè)申請(qǐng)的接口就是(register_blk_device), 申請(qǐng)了門牌號(hào),接著需要申請(qǐng)倉(cāng)庫(kù)了,也就是我們的gendisk, 通過(guò)alloc_disk完成,接著我們要申請(qǐng)倉(cāng)庫(kù)的關(guān)卡-請(qǐng)求隊(duì)列,通過(guò)alloc_queue完成,當(dāng)然我們要申明一下,并不是所有的虛擬倉(cāng)庫(kù)都會(huì)用到這個(gè)關(guān)卡即請(qǐng)求隊(duì)列,我們舉的例子中是沒(méi)有使用的,后面我們會(huì)舉例使用關(guān)卡的情況,在我們這個(gè)例子中,只有郊區(qū)的存儲(chǔ)室使用了請(qǐng)求隊(duì)列,如下圖,我們?cè)倜枋鲆幌驴纯?#xff0c;A/B/C三個(gè)虛擬倉(cāng)庫(kù)都有自己的請(qǐng)求隊(duì)列,但是都沒(méi)有實(shí)際使用,這當(dāng)然可以,操作系統(tǒng)并沒(méi)有強(qiáng)制規(guī)定,必須使用請(qǐng)求隊(duì)列,這是沒(méi)問(wèn)題的。這此我們介紹了三個(gè)很重要的虛擬倉(cāng)庫(kù)申請(qǐng)函數(shù),接下來(lái)我們讓重點(diǎn)描述一個(gè)函數(shù)- make_request, 我們繼續(xù)舉例,A/B/C每個(gè)臨時(shí)倉(cāng)庫(kù),接收到請(qǐng)求后要進(jìn)行加工處理,這就是make_request函數(shù),這也是過(guò)濾塊設(shè)備驅(qū)動(dòng)最核心的地方,那么我們?nèi)绾伟堰@個(gè)函數(shù)注冊(cè)到倉(cāng)庫(kù)里呢,通過(guò)blk_queue_make_request這個(gè)函數(shù)注冊(cè)的,是不是非常簡(jiǎn)單。到現(xiàn)在為止,我們已經(jīng)把過(guò)濾塊設(shè)備驅(qū)動(dòng)要構(gòu)建的操作全部描述完了,是的,事情就是那么回事,從此請(qǐng)求會(huì)經(jīng)過(guò)每層過(guò)濾驅(qū)動(dòng)的make_request函數(shù)依次傳遞下去,如何傳遞,我們會(huì)繼續(xù)介紹,但現(xiàn)在,讓我們先離開一下這個(gè)例子,開始分析一下代碼,從代碼上充分體會(huì)一下我們?nèi)绾螛?gòu)建一個(gè)最簡(jiǎn)單的過(guò)濾塊設(shè)備驅(qū)動(dòng)。
?
首先我們繼續(xù)假設(shè)一種情況,假設(shè)讀者去市區(qū)借書,沒(méi)有復(fù)印件,我們繼續(xù)去A那拿,不幸的是,A 壓根兒不理睬我們,直接拒絕了我們,好悲哀啊。接下來(lái),我們就是用170行代碼,把這個(gè)過(guò)程的程序代碼呈現(xiàn)給大家。
?
讓我們?cè)儆涀∵@幾個(gè)步驟:
1.????????????????????????????????????????????????????????????????????????????????????????????????注冊(cè)并申請(qǐng)門牌號(hào): register_blkdev
2.????????????????????????????????????????????????????????????????????????????????????????????????申請(qǐng)倉(cāng)庫(kù):alloc_disk
3.????????????????????????????????????????????????????????????????????????????????????????????????申請(qǐng)倉(cāng)庫(kù)的關(guān)卡:alloc_queue
4.????????????????????????????????????????????????????????????????????????????????????????????????注冊(cè)倉(cāng)庫(kù)的加工處理函數(shù):blk_queue_make_request
?
讓我們看一下內(nèi)核代碼是如何寫的。首先我們先給出全部的170行代碼,然后我們會(huì)從module_init函數(shù)開始閱讀理解,把我們上面提到的步驟一步一步驗(yàn)證一下,下面是全部的代碼。
fbd_driver.h
? 1#ifndef? _FBD_DRIVER_H
? 2#define? _FBD_DRIVER_H
? 3#include <linux/init.h>
? 4#include <linux/module.h>
? 5#include <linux/blkdev.h>
? 6#include <linux/bio.h>
? 7#include <linux/genhd.h>
? 8
? 9#define SECTOR_BITS???????????? (9)
?10#define DEV_NAME_LEN??????????? 32
?11#define DEV_SIZE??????????????? (512UL<< 20)?? /* 512M Bytes */
?12
?13#define DRIVER_NAME????????????"filter driver"
?14
?15#define DEVICE1_NAME???????????"fbd1_dev"
?16#define DEVICE1_MINOR?????????? 0
?17#define DEVICE2_NAME???????????"fbd2_dev"
?18#define DEVICE2_MINOR?????????? 1
?19
?20struct fbd_dev {
?21????????struct request_queue *queue;
?22????????struct gendisk *disk;
?23????????sector_t size;????????? /* devicesize in Bytes */
?24};
?25#endif
?
?
fbd_driver.c
? 1/**
?2? *? fbd-driver - filter block device driver
?3? *? Author: Talk@studio
? 4**/
? 5#include "fbd_driver.h"
? 6
? 7static int fbd_driver_major = 0;
? 8
? 9static struct fbd_dev fbd_dev1 = {NULL};
?10static struct fbd_dev fbd_dev2 = {NULL};
?11
?12static int fbddev_open(struct inode *inode, struct file *file);
?13 staticint fbddev_close(struct inode *inode, struct file *file);
?14
?15static struct block_device_operations disk_fops = {
?16????????.open = fbddev_open,
?17????????.release = fbddev_close,
?18????????.owner = THIS_MODULE,
?19};
?20
?21static int fbddev_open(struct inode *inode, struct file *file)
?22 {
?23????????printk("device is opened by:[%s]\n", current->comm);
?24????????return 0;
?25 }
?26
?27static int fbddev_close(struct inode *inode, struct file *file)
?28 {
?29????????printk("device is closed by:[%s]\n", current->comm);
?30????????return 0;
?31 }
?32
?33static int make_request(struct request_queue *q, struct bio *bio)
?34 {
?35????????struct fbd_dev *dev = (struct fbd_dev *)q->queuedata;
?36????????printk("device [%s] recevied [%s] io request, "
?37???????????????? "access on dev sector[%llu], length is [%u] sectors.\n",
?38???????????????? dev->disk->disk_name,
?39???????????????? bio_data_dir(bio) == READ ?"read" : "write",
?40???????????????? bio->bi_sector,
?41????????????????bio_sectors(bio));
?42
?43????????bio_endio(bio, bio->bi_size, 0);
?44????????return 0;
?45 }
?46
?47static int dev_create(struct fbd_dev *dev, char *dev_name, int major, intmi??? nor)
?48 {
?49????????int ret = 0;
?50
?51????????/* init fbd_dev */
?52????????dev->size = DEV_SIZE;
?53???????? dev->disk = alloc_disk(1);
?54????????if (!dev->disk) {
?55???????????????? printk("alloc diskerror");
?56???????????????? ret = -ENOMEM;
?57???????????????? goto err_out1;
?58????????}
?59
?60????? ???dev->queue = blk_alloc_queue(GFP_KERNEL);
?61????????if (!dev->queue) {
?62???????????????? printk("alloc queueerror");
?63???????????????? ret = -ENOMEM;
?64???????????????? goto err_out2;
?65????????}
?66
?67????????/* init queue */
?68????????blk_queue_make_request(dev->queue, make_request);
?69????????dev->queue->queuedata = dev;
?70
?71????????/* init gendisk */
?72????????strncpy(dev->disk->disk_name, dev_name, DEV_NAME_LEN);
?73????????dev->disk->major = major;
?74????????dev->disk->first_minor = minor;
?75????????dev->disk->fops = &disk_fops;
?76????????set_capacity(dev->disk, (dev->size >> SECTOR_BITS));
?77
?78?????????/* bind queue to disk */
?79???????? dev->disk->queue =dev->queue;
?80
?81????????/* add disk to kernel */
?82???????? add_disk(dev->disk);
?83????????return 0;
?84err_out2:
?85????????put_disk(dev->disk);
?86err_out1:
?87????????return ret;
?88 }
?89
?90static void dev_delete(struct fbd_dev *dev, char *name)
?91 {
?92????????printk("delete the device [%s]!\n", name);
?93????????blk_cleanup_queue(dev->queue);
?94????????del_gendisk(dev->disk);
?95????????put_disk(dev->disk);
?96 }
?97
?98static int __init fbd_driver_init(void)
?99 {
100????????int ret;
101
102????????/* register fbd driver, get the driver major number*/
103?????fbd_driver_major =register_blkdev(fbd_driver_major, DRIVER_NAME);
104????????if (fbd_driver_major < 0) {
105???????????????? printk("get majorfail");
106???????????????? ret = -EIO;
107???????????????? goto err_out1;
108 ????????}
109
110????????/* create the first device */
111????????ret = dev_create(&fbd_dev1, DEVICE1_NAME, fbd_driver_major,DEVICE1_MINOR);
112????????if (ret) {
113???????????????? printk("create device[%s] failed!\n", DEVICE1_NAME);
114?????????? ??????goto err_out2;
115????????}
116
117????????/* create the second device */
118????????ret = dev_create(&fbd_dev2, DEVICE2_NAME, fbd_driver_major,DEVICE2_MINOR);
119????????if (ret) {
120???????????????? printk("create device[%s] failed!\n", DEVICE2_NAME);
121???????????????? goto err_out3;
122????????}
123????????return ret;
124 err_out3:
125????????dev_delete(&fbd_dev1, DEVICE1_NAME);
126 err_out2:
127????????unregister_blkdev(fbd_driver_major, DRIVER_NAME);
128 err_out1:
129????????return ret;
130 }
131
132 static void __exitfbd_driver_exit(void)
133 {
134????????/* delete the two devices */
135????????dev_delete(&fbd_dev2, DEVICE2_NAME);
136????????dev_delete(&fbd_dev1, DEVICE1_NAME);
137
138????????/* unregister fbd driver */
139 ????????unregister_blkdev(fbd_driver_major,DRIVER_NAME);
140????????printk("block device driver exit successfuly!\n");
141 }
142
143 module_init(fbd_driver_init);
144 module_exit(fbd_driver_exit);
145 MODULE_LICENSE("GPL");
?
?
Makefile
? 1 obj-m := fbd_driver.o
? 2 KDIR := /lib/modules/$(shell uname-r)/build
? 3 PWD := $(shell pwd)
? 4 default:
? 5????????$(MAKE) -C $(KDIR) M=$(PWD) modules
? 6 clean:
? 7????????$(MAKE) -C $(KDIR) M=$(PWD) clean
? 8????????rm -rf Module.markers modules.order Module.symvers
?
一共三個(gè)文件,fbd_driver.c和fbd_driver.h兩個(gè)文件是源碼文件,Makefile文件是我們的編譯規(guī)則文件,大家可以回憶下這個(gè)Makefile文件是否與我們上冊(cè)一開始寫的簡(jiǎn)單內(nèi)核模塊中的Makefile文件非常類似,是的,內(nèi)核模塊的編譯規(guī)則和方法就是這么簡(jiǎn)單,我們不需要在這上面的花太多的精力,會(huì)讀懂和修改編譯規(guī)則即可。有興趣深入研究的同學(xué),我們附了一個(gè)專門講解Makefile規(guī)則語(yǔ)法的書,大家有選擇性查閱,更多的是掌握好基本的規(guī)則和當(dāng)成工具書方便查閱即可。
?
先看一下fbd_driver.h頭文件的內(nèi)容,首先看1-2行,這個(gè)非常有意思,是一個(gè)C語(yǔ)言語(yǔ)法中的條件編譯關(guān)鍵字,#ifndef _FBD_DRIVER_H 意思就是說(shuō)如果“_FBD_DRIVER_H”該宏沒(méi)有定義,則第2行用#define定義一下這個(gè)宏,然后再看第25行“#endif”,#ifndef 與 #endif是一對(duì)條件編譯關(guān)鍵字語(yǔ)法,作為頭文件中這么用的作用非常強(qiáng)大,它能夠防止我們?cè)?c文件中對(duì)頭文件重復(fù)包含,避免代碼冗余,大家體會(huì)一下這個(gè)用法。接下來(lái)3-7行共包含了5個(gè)頭文件,這5個(gè)頭文件是我們這個(gè)過(guò)濾塊設(shè)備驅(qū)動(dòng)實(shí)現(xiàn)需要引用的頭文件,它們中有我們需要的一些函數(shù)API接口聲明和數(shù)據(jù)結(jié)構(gòu)的定義,其中一個(gè)我們一定不陌生就是module.h,任何一個(gè)內(nèi)核模塊不管它是塊設(shè)備驅(qū)動(dòng),還是其它內(nèi)核驅(qū)動(dòng)模塊,這個(gè)頭文件是一定要包含的。然后bio.h/blkdev.h/genhd.h是內(nèi)核塊設(shè)備驅(qū)動(dòng)必須要包含的三個(gè)頭文件,內(nèi)核的頭文件命名上很有意義,基本上相關(guān)的內(nèi)核API調(diào)用會(huì)放在相應(yīng)的頭文件中,這里我們先不具體介紹這三個(gè)頭文件,在下一章節(jié)我們具體分析塊設(shè)備驅(qū)動(dòng)核心數(shù)據(jù)結(jié)構(gòu)及API接口聲明時(shí)再詳細(xì)分析,我們繼續(xù)往下走。第9行是定義了扇區(qū)比特?cái)?shù)是9,對(duì)于塊設(shè)備,扇區(qū)是其最小的傳輸和存儲(chǔ)單位,是按扇區(qū)來(lái)劃分的,默認(rèn)扇區(qū)大小是512字節(jié),這里的9代表512如果換算為二進(jìn)制需要多少位描述,我們一定很快算出來(lái)就是2^9 = 512,后面我們會(huì)經(jīng)常遇到這樣的二進(jìn)制轉(zhuǎn)換描述,在內(nèi)核中是經(jīng)常遇到的。第10行,我們定義的宏叫DISK_NAME_LEN,表示我們要寫的過(guò)濾塊設(shè)備的名字最大是32個(gè)字節(jié),第11行定義了我們要?jiǎng)?chuàng)建的過(guò)濾塊設(shè)備大小是512M,1左移20位是1M,再乘以扇區(qū)大小即是512M。
?
第13-18行定義我們定義了驅(qū)動(dòng)程序注冊(cè)的名字“fbd_driver”,及通過(guò)過(guò)濾塊設(shè)備驅(qū)動(dòng)程序創(chuàng)建的過(guò)濾塊設(shè)備名字叫“fbd1_dev”和”fbd2_dev”。
?
接下來(lái)20-24行,我們定義了一個(gè)數(shù)據(jù)結(jié)構(gòu)結(jié)構(gòu)體叫fbd_dev,這個(gè)結(jié)構(gòu)體里面有三個(gè)成員,首先是一個(gè)queue指針成員,然后是disk指針,最后是設(shè)備大小,這個(gè)結(jié)構(gòu)體用于描述我們創(chuàng)建的過(guò)濾塊設(shè)備,從我們前面列舉的圖書館的例子,大家應(yīng)該可以對(duì)上號(hào)了,
?
?
好了準(zhǔn)備工作一切就緒,我們開始分析源碼文件fbd_driver.c,由于內(nèi)核驅(qū)動(dòng)模塊的特殊性,我們向系統(tǒng)加載一個(gè)模塊時(shí)linux內(nèi)核一定會(huì)首先調(diào)用module_init所約定的函數(shù),注意看143行代碼,module_init是內(nèi)核的一個(gè)API, 我們所寫的驅(qū)動(dòng)模塊一定要寫143/144這樣兩行代碼,告訴內(nèi)核我們的模塊加載時(shí)會(huì)執(zhí)行module_init的約定函數(shù),模塊卸載時(shí)會(huì)執(zhí)行module_exit的約定函數(shù),好的,先記住這個(gè)。然后對(duì)于我們的過(guò)濾塊設(shè)備驅(qū)動(dòng)來(lái)說(shuō),我們要如何設(shè)計(jì)module--_init約定的初始化函數(shù)呢,接下來(lái)我們介紹104行代碼中的這個(gè) fbd_driver--_init函數(shù)。至于module_init的具體實(shí)現(xiàn)原理我們希望大家現(xiàn)在暫時(shí)先沉住氣,不要去分析,有時(shí)候先放一放,把精力用在最主要的事情上是非常好的一個(gè)方法。現(xiàn)在先來(lái)看這個(gè)加載模塊時(shí)就會(huì)被執(zhí)行的函數(shù)fbd_driver_init函數(shù)。我們?cè)侔汛a貼一下:
?
?95static int __init fbd_driver_init(void)
?96 {
?97????????int ret;
?98
?99????????/* register fbd driver, get the driver major number*/
100???????? ??fbd_driver_major =register_blkdev(fbd_driver_major, DRIVER_NAME);
101????????if (fbd_driver_major < 0) {
102???????????????? printk("get majorfail");
103???????????????? ret = -EIO;
104???????????????? goto err_out1;
105????????}
106
107????????/* create the first device */
108????????ret = dev_create(&fbd_dev1, DEVICE1_NAME, fbd_driver_major,DEVICE1_??? MINOR);
109????????if (ret) {
110???????????????? printk("create device[%s] failed!\n", DEVICE1_NAME);
111???????????????? goto err_out2;
112????????}
113
114????????/* create the second device */
115????????ret = dev_create(&fbd_dev2, DEVICE2_NAME, fbd_driver_major,DEVICE2_??? MINOR);
116????????if (ret) {
117???????????????? printk("create device[%s] failed!\n", DEVICE2_NAME);
118????????????????goto err_out3;
119????????}
120
121????????return ret;
122
123 err_out3:
124????????dev_delete(&fbd_dev1, DEVICE1_NAME);
125 err_out2:
126????????unregister_blkdev(fbd_driver_major, DRIVER_NAME);
127 err_out1:
128????????return ret;
129 }
?
首先函數(shù)是一個(gè)static函數(shù),這個(gè)是C語(yǔ)言的一個(gè)基本語(yǔ)法,表示該函數(shù)只能在當(dāng)前的文件中被調(diào)用,static后面是int 表示該函數(shù)返回值是整型,然后是__init, 這個(gè)需要大家注意一下,這是gcc的一個(gè)語(yǔ)法,gcc是編譯器,這個(gè)__init就是告訴gcc在編譯后,在代碼運(yùn)行時(shí)把這個(gè)函數(shù)的代碼放在特殊的內(nèi)存區(qū)域,函數(shù)執(zhí)行完畢,這部分內(nèi)存就會(huì)被linux內(nèi)核回收,因?yàn)檫@個(gè)函數(shù)是模塊加載時(shí)就只會(huì)調(diào)用一次的函數(shù),后面不會(huì)再有人用這個(gè)函數(shù)了,所以執(zhí)行完,就可以釋放出占用的內(nèi)存。
?
說(shuō)到這希望大家還沒(méi)有忘記我們開頭提的4個(gè)步驟,我們?cè)賳乱幌聣K設(shè)備驅(qū)動(dòng)程序需要做4件非常重要的準(zhǔn)備工作:
?
1.????????????????????????????????????????????????????????????????????????????????????????????????注冊(cè)并申請(qǐng)門牌號(hào): register_blk_device
2.????????????????????????????????????????????????????????????????????????????????????????????????申請(qǐng)倉(cāng)庫(kù):alloc_disk
3.????????????????????????????????????????????????????????????????????????????????????????????????申請(qǐng)倉(cāng)庫(kù)的關(guān)卡:alloc_queue
4.????????????????????????????????????????????????????????????????????????????????????????????????注冊(cè)倉(cāng)庫(kù)的加工處理函數(shù):blk_queue_make_request
?
我們稍等一下,再介紹一下一個(gè)我們自己定義數(shù)據(jù)結(jié)構(gòu),也就是我們的倉(cāng)庫(kù)的一個(gè)描述性結(jié)構(gòu),這個(gè)結(jié)構(gòu)只有我們自己寫這個(gè)過(guò)濾塊設(shè)備驅(qū)動(dòng)的作者知道,這個(gè)結(jié)構(gòu)對(duì)于linux內(nèi)核是不可見的,我們內(nèi)部使用而已,如下:
?
fbd_driver.h
?
?20struct fbd_dev {
?21????????struct request_queue *queue;
?22????????struct gendisk *disk;
?23????????sector_t size;????????? /* devicesize in Bytes */
?24};
?
?
好了,準(zhǔn)備工作一切就緒,然后揭開塊設(shè)備過(guò)濾驅(qū)動(dòng)的面紗,開始分析fbd_driver_init函數(shù)吧,大家從此刻開始要打起二十分的精力,這是構(gòu)建塊設(shè)備驅(qū)動(dòng)最核心的部分。
?
fbd_driver_init這個(gè)函數(shù)首先調(diào)用register_blk_device函數(shù),獲取到了塊設(shè)備驅(qū)動(dòng)程序的主設(shè)備號(hào),register_blkdev終于浮出水面了,還記得那4個(gè)步驟不?第一步注冊(cè)并申請(qǐng)門牌號(hào),對(duì)就是它,我們要向系統(tǒng)申請(qǐng)和注冊(cè),第一個(gè)參數(shù)就是一個(gè)初始化的major號(hào),第二參數(shù)是我們塊設(shè)備驅(qū)動(dòng)的名字,這里我們第一參數(shù)是0, 此時(shí)系統(tǒng)會(huì)去它自己管理的登記情況表上看看是否有不用的號(hào)碼可以我們,如果有就會(huì)我們一個(gè),這就是regiser_blkdev的返回值,那這個(gè)第一個(gè)參數(shù)一定要是0嗎?不需要的,如果你選好自己的幸運(yùn)數(shù)字了比如8,你可以把8傳入這個(gè)函數(shù),但是要小心了,系統(tǒng)里面如果有那位仁兄已經(jīng)申請(qǐng)過(guò)這個(gè)8了,很不幸,就會(huì)申請(qǐng)失敗。然后調(diào)用兩次dev_create函數(shù)創(chuàng)建了兩個(gè)塊設(shè)備,fbd_driver-_init函數(shù)比較簡(jiǎn)單,通過(guò)register_blk_device申請(qǐng)到門牌號(hào)(主設(shè)備號(hào))后,我們直接跟進(jìn)到dev_create函數(shù)中分析,代碼如下:
?
?47static int dev_create(struct fbd_dev *dev, char *dev_name, int major, intmi??? nor)
?48 {
?49????????int ret = 0;
?50
?51????????/* init fbd_dev */
?52????????dev->size = DEV_SIZE;
?53???????? dev->disk = alloc_disk(1);
?54????????if (!dev->disk) {
?55???????????????? printk("alloc diskerror");
?56???????????????? ret = -ENOMEM;
?57???????????????? goto err_out1;
?58????????}
?59
?60????????dev->queue = blk_alloc_queue(GFP_KERNEL);
?61????????if (!dev->queue) {
?62???????????????? printk("alloc queueerror");
?63???????????????? ret = -ENOMEM;
?64?????????????? ??goto err_out2;
?65????????}
?66
?67????????/* init queue */
?68????????blk_queue_make_request(dev->queue, make_request);
?69????????dev->queue->queuedata = dev;
?70
?71????????/* init gendisk */
?72????????strncpy(dev->disk->disk_name, dev_name, DEV_NAME_LEN);
?73????????dev->disk->major = major;
?74????????dev->disk->first_minor = minor;
?75????????dev->disk->fops = &disk_fops;
?76????????set_capacity(dev->disk, (dev->size >> SECTOR_BITS));
?77
?78?????????/* bind queue to disk */
?79????? ???dev->disk->queue = dev->queue;
?80
?81????????/* add disk to kernel */
?82????????add_disk(dev->disk);
?83????????return 0;
?84err_out2:
?85????????put_disk(dev->disk);
?86err_out1:
?87????????return ret;
?88 }
?
?
首先第49行,我們定義了一個(gè)整型變量,用于記錄塊設(shè)備驅(qū)動(dòng)初始化過(guò)程中的返回值,再看53行到57行,接下來(lái)申請(qǐng)我們的倉(cāng)庫(kù)gendisk,我們看到是通過(guò)調(diào)用alloc_disk這個(gè)函數(shù),我們得到了gendisk結(jié)構(gòu),我們依然不去細(xì)說(shuō)gendisk中的具體字段,在第二節(jié)詳細(xì)分析。
?
申請(qǐng)完倉(cāng)庫(kù),我們要建立關(guān)卡了,只有經(jīng)過(guò)關(guān)卡,才能進(jìn)入倉(cāng)庫(kù),是的,這就是入庫(kù)前的規(guī)則,當(dāng)前關(guān)卡申請(qǐng)了,可以用也可以不用。我們的過(guò)濾塊設(shè)備驅(qū)動(dòng)就是這樣,申請(qǐng)了,但是沒(méi)用,但是注意一定要申請(qǐng)的。
?
接著我們看60行-65行,我們看到了申請(qǐng)關(guān)卡的函數(shù)blk_alloc_queue函數(shù),這樣我們就有申請(qǐng)到了一個(gè)數(shù)據(jù)結(jié)構(gòu)。三個(gè)步驟我們已經(jīng)走完了三個(gè),我們都沒(méi)有介紹數(shù)據(jù)結(jié)構(gòu)里面的具體成員,接下來(lái)我們繼續(xù)做第四個(gè)步驟,注冊(cè)我們的倉(cāng)庫(kù)加工函數(shù)- 請(qǐng)求處理函數(shù)make_request。
?
我們看68行代碼,我們?cè)俅钨N一下:
?
?67???????? /* init queue */
?68????????blk_queue_make_request(dev->queue, make_request);
?69????????dev->queue->queuedata = dev;
?
?
調(diào)用的函數(shù)是blk_queue_make_request, 第一參數(shù)是我們剛剛申請(qǐng)到的請(qǐng)求隊(duì)列,第二個(gè)參數(shù)就是我們自己寫好的make_request函數(shù)名,這個(gè)函數(shù)我們待會(huì)分析它。然后注意69行,我們做了一個(gè)賦值操作,把我們的設(shè)備描述結(jié)構(gòu)綁定給了request_queue的一個(gè)成員變量queuedata。
?
接下來(lái),我們要對(duì)我們申請(qǐng)的倉(cāng)庫(kù)裝飾一下,代碼同樣再貼一下:
?
?71???????? /* init gendisk */
?72????????strncpy(dev->disk->disk_name, dev_name, DEV_NAME_LEN);
?73????????dev->disk->major = major;
?74????????dev->disk->first_minor = minor;
?75????????dev->disk->fops = &disk_fops;
?76????????set_capacity(dev->disk, (dev->size >> SECTOR_BITS));
?77
?78????????? /* bind queue to disk */
?79????? ???dev->disk->queue = dev->queue;
?80
?
72行代碼是給gendisk的disk_name成員賦值,就是給我們的倉(cāng)庫(kù)取名字。73行代碼就是把我們申請(qǐng)到的門牌號(hào)賦值給disk的成員major,74行我們賦值了一個(gè)次設(shè)備號(hào),75行我們?yōu)間endisk的文件操作函數(shù)賦值了一個(gè)函數(shù)指針集結(jié)構(gòu)體,這個(gè)我們?cè)谏院蠓治?#xff0c;最后76行我們?cè)O(shè)置了設(shè)備的容量大小為512M。
?
79行代碼就是把我們申請(qǐng)的queue地址保存在disk中,這樣倉(cāng)庫(kù)和關(guān)卡就綁定在一起了,同時(shí)我們也知道了disk中有個(gè)成員叫queue, 是個(gè)指針,對(duì)吧,我們沒(méi)有放棄詳細(xì)說(shuō)明數(shù)據(jù)結(jié)構(gòu)中的成員,只不過(guò)在我們遇到的時(shí)候我們一定會(huì)予以介紹,然后在第二節(jié)詳細(xì)總結(jié)分析。
?
?
好了我們已經(jīng)申請(qǐng)注冊(cè)了門牌號(hào),申請(qǐng)了倉(cāng)庫(kù),申請(qǐng)了關(guān)卡,給倉(cāng)庫(kù)安裝了加工函數(shù),對(duì)我們的倉(cāng)庫(kù)進(jìn)行了裝飾,就可以了嗎?還差最后一個(gè)關(guān)鍵步驟,非常的重要,就是告訴內(nèi)核我們的倉(cāng)庫(kù)需要審核一下,如果通過(guò),那恭喜你,你的倉(cāng)庫(kù)建好了,那這個(gè)步驟就是82行代碼:
?
?81????????/* add disk to kernel */
?82????????add_disk(dev->disk);
?
好了我們終于建好自己的倉(cāng)庫(kù)了,稍等,我們還有一個(gè)沒(méi)有分析,就是我們倉(cāng)庫(kù)的加工函數(shù)make_request,讓我們趕緊看看前面圖書館例子中的請(qǐng)求處理函數(shù)的功能是什么,我們說(shuō)過(guò)我們的過(guò)濾塊設(shè)備驅(qū)動(dòng)在接受到請(qǐng)求后不做任何處理,直接結(jié)束請(qǐng)求,我們看看到底是如何實(shí)現(xiàn)的。
?
?33static int make_request(struct request_queue *q, struct bio *bio)
?34 {
?35????????struct fbd_dev *dev = (struct fbd_dev *)q->queuedata;
?36????????printk("device [%s] recevied [%s] io request, "
?37???????????????? "access on dev sector[%llu], length is [%u] sectors.\n",
?38???????????????? dev->disk->disk_name,
?39???????????????? bio_data_dir(bio) == READ ?"read" : "write",
?40???????????????? bio->bi_sector,
?41???????????????? bio_sectors(bio));
?42
?43????????bio_endio(bio, bio->bi_size, 0);
?44????????return 0;
?45 }
這個(gè)函數(shù)輸入?yún)?shù)就是我們的關(guān)卡請(qǐng)求隊(duì)列,第二個(gè)參數(shù)就是上層準(zhǔn)備好的盒子bio請(qǐng)求描述結(jié)構(gòu)指針,我們的函數(shù)就調(diào)了個(gè)bio_endio就完事了,是的,這個(gè)函數(shù)就是用于結(jié)束一個(gè)請(qǐng)求bio的,這樣我們就知道了為什么請(qǐng)求到我們的倉(cāng)庫(kù),就會(huì)結(jié)束,是因?yàn)槲覀兊募庸ず瘮?shù)就是通過(guò)調(diào)用bio_endio做到的。
?
至此我們終于完成了一個(gè)最簡(jiǎn)單的過(guò)濾塊設(shè)備驅(qū)動(dòng)的開發(fā),趕緊試試吧,在自己的虛擬上,執(zhí)行make,得到fbd_driver.ko后,加載你的驅(qū)動(dòng)insmod fbd_driver.ko,在/dev/下面是否可以看到我們的過(guò)濾設(shè)備/dev/fbd1_dev和/dev/fbd2_dev,對(duì)其進(jìn)行dd操作然后看dmesg信息,從dmesg命令顯示的信息中我們會(huì)看到如下信息,比如執(zhí)行:
?
[root@localhost fbd_driver_stage1]# ddif=/dev/zero of=/dev/fbd1_dev bs=1M oflag=direct count=1
1+0 records in
1+0 records out
1048576 bytes(1.0 MB) copied, 0.038983 seconds, 26.9 MB/s
[root@localhost fbd_driver_stage1]# dmesg
device is openedby:[dd]
device[fbd1_dev] recevied [write] io request, access on dev sector [0], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [248], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [496], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [744], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [992], length is[248] sectors.
device [fbd1_dev]recevied [write] io request, access on dev sector [1240], length is [248]sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [1488], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [1736], length is[248] sectors.
device[fbd1_dev] recevied [write] io request, access on dev sector [1984], length is[64] sectors.
device is closedby:[dd]
[root@localhostfbd_driver_stage1]#
75行我們?yōu)間endisk的文件操作函數(shù)賦值了一個(gè)函數(shù)指針集結(jié)構(gòu)體,我們繼續(xù)通過(guò)分析dmesg的信息完成這個(gè)解讀,我們做dd寫了一個(gè)1M的數(shù)據(jù),看到了
“device is openedby:[dd]” 和 “device is closed by:[dd]” 這兩行信息,這就是下面fbddev_open和fbddev_close函數(shù)打出的,這樣我們應(yīng)該能夠理解了,這兩個(gè)函數(shù)指針就是我們創(chuàng)建的塊設(shè)備被打開時(shí)和關(guān)閉時(shí)會(huì)調(diào)用到,我們都寫過(guò)這樣的簡(jiǎn)單程序open/read/close,對(duì)吧,只不過(guò)我們跑的dd命令包含了這三個(gè)函數(shù)調(diào)用。
?
?
?15static struct block_device_operations disk_fops = {
?16????????.open = fbddev_open,
?17????????.release = fbddev_close,
?18????????.owner = THIS_MODULE,
?19};
?20
?21static int fbddev_open(struct inode *inode, struct file *file)
?22 {
?23????????printk("device is opened by:[%s]\n", current->comm);
?24????????return 0;
?25 }
?26
?27static int fbddev_close(struct inode *inode, struct file *file)
?28 {
?29????????printk("device is closed by:[%s]\n", current->comm);
?30????????return 0;
?31 }
?
?
這就是我們這個(gè)最簡(jiǎn)單的過(guò)濾塊設(shè)備驅(qū)動(dòng),由于在make_request函數(shù)中我們直接調(diào)用bio_endio,這個(gè)函數(shù)的作用是直接返回收到的請(qǐng)求,不做任何處理,這樣我們寫入的1M數(shù)據(jù)實(shí)際并沒(méi)有處理,而是直接返回了。在第三節(jié)我們會(huì)繼續(xù)完善這個(gè)170行代碼的驅(qū)動(dòng),讓我們的驅(qū)動(dòng)能夠真正的過(guò)濾請(qǐng)求,而不是直接退出請(qǐng)求處理。
總結(jié)
以上是生活随笔為你收集整理的转载:谢谢原作者:块设备驱动实战基础篇一 (170行代码构建一个逻辑块设备驱动)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Linux kernel block d
- 下一篇: 转载:谢谢原作者: 块设备驱动实战基础篇