Linux网络编程 之 IO复用epoll(十)
1. epoll概述
相對于 select() 和 poll() 來說,epoll 更加靈活,沒有描述符限制。epoll 使用一個(gè)文件描述符管理多個(gè)描述符,將用戶關(guān)系的文件描述符的事件存放到內(nèi)核的一個(gè)事件表中,這樣在用戶空間和內(nèi)核空間的 copy 只需一次。
2. epoll的接口函數(shù)
為了在后面更加方便理解epoll的原理,我們先從接口函數(shù)開始下手:
epoll_create
創(chuàng)建epoll句柄
函數(shù)聲明:int epoll_create(int size)
參數(shù):size用來告訴內(nèi)核這個(gè)監(jiān)聽的數(shù)目一共有多大。
返回值:返回創(chuàng)建了的epoll句柄。
當(dāng)創(chuàng)建好epoll句柄后,它就是會占用一個(gè)fd值,在linux下如果查看/proc/進(jìn)程id/fd/,是能夠看到這個(gè)fd的,所以在使用完epoll后,必須調(diào)用close()關(guān)閉,否則可能導(dǎo)致fd被耗盡。
epoll_ctl
將被監(jiān)聽的描述符添加到epoll句柄或從epool句柄中刪除或者對監(jiān)聽事件進(jìn)行修改。
函數(shù)申明:int epoll_ctl(int epfd, int op, int fd, struct epoll_event*event);
參數(shù):
epfd: epoll_create()的返回值
op:表示要進(jìn)行的操作,其值分別為:
EPOLL_CTL_ADD: 注冊新的fd到epfd中;
EPOLL_CTL_MOD: 修改已經(jīng)注冊的fd的監(jiān)聽事件;
EPOLL_CTL_DEL: 從epfd中刪除一個(gè)fd;
fd:需要操作/監(jiān)聽的文件句柄
event:是告訴內(nèi)核需要監(jiān)聽什么事件,struct epoll_event如下:
events可以是以下幾個(gè)宏的集合:
- EPOLLIN:觸發(fā)該事件,表示對應(yīng)的文件描述符上有可讀數(shù)據(jù)。(包括對端SOCKET正常關(guān)閉);
- EPOLLOUT:觸發(fā)該事件,表示對應(yīng)的文件描述符上可以寫數(shù)據(jù);
- EPOLLPRI:表示對應(yīng)的文件描述符有緊急的數(shù)據(jù)可讀(這里應(yīng)該表示有帶外數(shù)據(jù)到來);
- EPOLLERR:表示對應(yīng)的文件描述符發(fā)生錯(cuò)誤;
- EPOLLHUP: 表示對應(yīng)的文件描述符被掛斷;
- EPOLLET:將EPOLL設(shè)為邊緣觸發(fā)(EdgeTriggered)模式,這是相對于水平觸發(fā)(Level Triggered)來說的。
- EPOLLONESHOT: 只監(jiān)聽一次事件,當(dāng)監(jiān)聽完這次事件之后,如果還需要繼續(xù)監(jiān)聽這個(gè)socket的話,需要再次把這個(gè)socket加入到EPOLL隊(duì)列里。
等侍注冊在epfd上的socket fd的事件的發(fā)生,如果發(fā)生則將發(fā)生的sokct fd和事件類型放入到events數(shù)組中。
函數(shù)原型:int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
參數(shù):
epfd:由epoll_create 生成的epoll文件描述符
events:用于回傳代處理事件的數(shù)組
maxevents:每次能處理的最大事件數(shù)
timeout:等待I/O事件發(fā)生的超時(shí)毫秒數(shù),-1相當(dāng)于阻塞,0相當(dāng)于非阻塞。一般用-1即可。
3. epoll實(shí)現(xiàn)機(jī)制
當(dāng)某一進(jìn)程調(diào)用epoll_create方法時(shí),Linux內(nèi)核會創(chuàng)建一個(gè)eventpoll結(jié)構(gòu)體,這個(gè)結(jié)構(gòu)體中有兩個(gè)成員與epoll的使用方式密切相關(guān)。eventpoll結(jié)構(gòu)體如下所示:
struct eventpoll{..../*紅黑樹的根節(jié)點(diǎn),這顆樹中存儲著所有添加到epoll中的需要監(jiān)控的事件*/struct rb_root rbr;/*雙鏈表中則存放著將要通過epoll_wait返回給用戶的滿足條件的事件*/struct list_head rdlist;.... };內(nèi)部用了一個(gè)紅黑樹記錄添加的socket,用了一個(gè)雙向鏈表接收內(nèi)核觸發(fā)的事件。
然后我們通過epoll_ctl方法向epoll對象中添加進(jìn)來的事件。
這些事件都會掛載在紅黑樹中,如此,重復(fù)添加的事件就可以通過紅黑樹而高效的識別出來(紅黑樹的插入時(shí)間效率是lgn,其中n為樹的高度)。
而所有添加到epoll中的事件都會與設(shè)備(網(wǎng)卡)驅(qū)動程序建立回調(diào)關(guān)系,也就是說,當(dāng)相應(yīng)的事件發(fā)生時(shí)會調(diào)用這個(gè)回調(diào)方法。這個(gè)回調(diào)方法在內(nèi)核中叫ep_poll_callback,它會將發(fā)生的事件添加到rdlist雙鏈表中。
在epoll中,對于每一個(gè)事件,都會建立一個(gè)epitem結(jié)構(gòu)體,如下所示:
struct epitem{struct rb_node rbn;//紅黑樹節(jié)點(diǎn)struct list_head rdllink;//雙向鏈表節(jié)點(diǎn)struct epoll_filefd ffd; //事件句柄信息struct eventpoll *ep; //指向其所屬的eventpoll對象struct epoll_event event; //期待發(fā)生的事件類型 }當(dāng)調(diào)用epoll_wait檢查是否有事件發(fā)生時(shí),只需要檢查eventpoll對象中的rdlist雙鏈表中是否有epitem元素即可。如果rdlist不為空,則把發(fā)生的事件復(fù)制到用戶態(tài),同時(shí)將事件數(shù)量返回給用戶。
4. epoll的工作模式
ET(EdgeTriggered):高速工作模式,只支持no_block(非阻塞模式)。在此模式下,當(dāng)描述符從未就緒變?yōu)榫途w時(shí),內(nèi)核通過epoll告知。然后它會假設(shè)用戶知道文件描述符已經(jīng)就緒,并且不會再為那個(gè)文件描述符發(fā)送更多的就緒通知,直到某些操作導(dǎo)致那個(gè)文件描述符不再為就緒狀態(tài)了。(觸發(fā)模式只在數(shù)據(jù)就緒時(shí)通知一次,若數(shù)據(jù)沒有讀完,下一次不會通知,直到有新的就緒數(shù)據(jù))
LT(LevelTriggered):缺省工作方式,支持blocksocket和no_blocksocket。在LT模式下內(nèi)核會告知一個(gè)文件描述符是否就緒了,然后可以對這個(gè)就緒的fd進(jìn)行IO操作。如果不作任何操作,內(nèi)核還是會繼續(xù)通知!若數(shù)據(jù)沒有讀完,內(nèi)核也會繼續(xù)通知,直至設(shè)備數(shù)據(jù)為空為止!
二者的差異在于level-trigger模式下只要某個(gè)socket處于readable/writable狀態(tài),無論什么時(shí)候進(jìn)行epoll_wait都會返回該socket;而edge-trigger模式下只有某個(gè)socket從unreadable變?yōu)閞eadable或從unwritable變?yōu)閣ritable時(shí),epoll_wait才會返回該socket。
從本質(zhì)上講:與LT相比,ET模型是通過減少系統(tǒng)調(diào)用來達(dá)到提高并行效率的。
總結(jié)
以上是生活随笔為你收集整理的Linux网络编程 之 IO复用epoll(十)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux网络编程 之 IO多路复用po
- 下一篇: linux 安装tomcat遇到的问题