(转载)Linux多线程实现
轉載自:https://www.cnblogs.com/zhaoyl/p/3620204.html
首先從OS設計原理上闡明三種線程:內核線程、輕量級進程、用戶線程
內核線程
內核線程就是內核的分身,一個分身可以處理一件特定事情。這在處理異步事件如異步IO時特別有用。內核線程的使用是廉價的,唯一使用的資源就是內核棧和上下文切換時保存寄存器的空間。支持多線程的內核叫做多線程內核(Multi-Threads kernel )。
輕量級進程
輕量級線程(LWP)是一種由內核支持的用戶線程。它是基于內核線程的高級抽象,因此只有先支持內核線程,才能有LWP。每一個進程有一個或多個LWPs,每個LWP由一個內核線程支持。這種模型實際上就是恐龍書上所提到的一對一線程模型。在這種實現的操作系統中,LWP就是用戶線程。
由于每個LWP都與一個特定的內核線程關聯,因此每個LWP都是一個獨立的線程調度單元。即使有一個LWP在系統調用中阻塞,也不會影響整個進程的執行。
輕量級進程具有局限性。首先,大多數LWP的操作,如建立、析構以及同步,都需要進行系統調用。系統調用的代價相對較高:需要在user mode和kernel mode中切換。其次,每個LWP都需要有一個內核線程支持,因此LWP要消耗內核資源(內核線程的棧空間)。因此一個系統不能支持大量的LWP。
注:
LWP?的術語是借自于?SVR4/MP?和?Solaris 2.x?。有些系統將?LWP?稱為虛擬處理器。而將之稱為輕量級進程的原因可能是:在內核線程的支持下,?LWP?是獨立的調度單元,就像普通的進程一樣。所以?LWP?的最大特點還是每個?LWP?都有一個內核線程支持。
?
用戶線程
LWP雖然本質上屬于用戶線程,但LWP線程庫是建立在內核之上的,LWP的許多操作都要進行系統調用,因此效率不高。而這里的用戶線程指的是完全建立在用戶空間的線程庫,用戶線程的建立,同步,銷毀,調度完全在用戶空間完成,不需要內核的幫助。因此這種線程的操作是極其快速的且低消耗的。
?
上圖是最初的一個用戶線程模型,從中可以看出,進程中包含線程,用戶線程在用戶空間中實現,內核并沒有直接對用戶線程進程調度,內核的調度對象和傳統進程一樣,還是進程本身,內核并不知道用戶線程的存在。用戶線程之間的調度由在用戶空間實現的線程庫實現。
這種模型對應著恐龍書中提到的多對一線程模型,其缺點是一個用戶線程如果阻塞在系統調用中,則整個進程都將會阻塞。
?
加強版的用戶線程——用戶線程+LWP
這種模型對應著恐龍書中多對多模型。用戶線程庫還是完全建立在用戶空間中,因此用戶線程的操作還是很廉價,因此可以建立任意多需要的用戶線程。操作系統提供了?LWP?作為用戶線程和內核線程之間的橋梁。?LWP?還是和前面提到的一樣,具有內核線程支持,是內核的調度單元,并且用戶線程的系統調用要通過?LWP?,因此進程中某個用戶線程的阻塞不會影響整個進程的執行。用戶線程庫將建立的用戶線程關聯到?LWP?上,?LWP?與用戶線程的數量不一定一致。當內核調度到某個?LWP?上時,此時與該?LWP?關聯的用戶線程就被執行。
?
很多文獻中都認為輕量級進程就是線程,實際上這種說法并不完全正確,從前面的分析中可以看到,只有在用戶線程完全由輕量級進程構成時,才可以說輕量級進程就是線程
?
LinuxThreads
所實現的就是基于核心輕量級進程的"一對一"線程模型,一個線程實體對應一個核心輕量級進程,而線程之間的管理在核外函數庫(我們常用的pthread庫)中實現。?一直以來, linux內核并沒有線程的概念. 每一個執行實體都是一個task_struct結構, 通常稱之為進程.?
進程是一個執行單元, 維護著執行相關的動態資源. 同時, 它又引用著程序所需的靜態資源.通過系統調用clone創建子進程時, 可以有選擇性地讓子進程共享父進程所引用的資源. 這樣的子進程通常稱為輕量級進程,如上文所述,又叫內核線程。
[插曲]說下fork和vfork的區別fork時,子進程是父進程的一個拷貝。子進程從父進程那得到了數據段和堆棧段,但不是與父進程共享而是單獨分配內存。然而這里的非共享最初狀態是共享的,linux下使用了寫時復制技術,剛開始共享父進程的數據段,在寫數據段的時候才進行復制,以fork為例,最終共享的資源就是task_struct、系統空間堆棧(copy_thread)、頁面表等。vfork時,因為實現為子進程先執行,所以是不拷貝(沒必要)父進的虛存空間,也就是用戶空間堆棧,clone(clone_vfork|clone_vm|sigchld,0),指明的參數是不會拷貝,注定共享的。因為現在的fork都是寫實拷貝,所以vfork的優勢便不明顯了——只是不用向vfork那樣拷貝頁表。另外,內核都是優先讓子進程先執行,考慮到調度問題,fork不保證;但vfork可保證這點 2.4內核 do_dork是fork/vfork/clone系統調用的共同代碼,其核心流程如下:1) 默認對所有資源進行共享暫不復制;2) 如果flags未指定共享(相應位為0),則進行深層次復制。包括,file,fs,sighand,mm。以CLONE_FILES為例,對fork而言為1,也就是必須復制兩份files,這樣父子進程才有獨立上下文(各自獨立lseek不影響,但是文件指針肯定還是指向一個);但是對于vfork,這個標志為1,也就是父子進程共享文件上下文(注意這里不是共享文件指針,連上下文都共享!也就是子進程lseek會改變父進程讀寫位置),這豈不亂套(類似還有vfork的CLONE_VM標志)!別擔心,do_fork中會保證vfork時候,自進程先執行完!特殊說下,mm資源即使是非共享的,即CLONE_VM=1(fork如此),也不馬上復制,而是復制頁面表后,把也表項設置為寫保護,這樣無論誰寫,屆時都會再復制一份出來,這才完成的資源的獨立——對fork而言。3) 復制系統堆棧(區別于用戶空間VM)
用戶態線程由pthread庫實現,使用pthread以后, 在用戶看來, 每一個task_struct就對應一個線程, 而一組線程以及它們所共同引用的一組資源就是一個進程. 但是, 一組線程并不僅僅是引用同一組資源就夠了, 它們還必須被視為一個整體.
?
?轉載于:https://www.cnblogs.com/SoftAndHard/p/8553756.html
總結
以上是生活随笔為你收集整理的(转载)Linux多线程实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PHP入门04 -- 面向对象程序设计
- 下一篇: Linux SSH基础