日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > linux >内容正文

linux

linux物理内存虚拟内存一致,Liunx内存管理的调用和实现

發(fā)布時間:2024/10/8 linux 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 linux物理内存虚拟内存一致,Liunx内存管理的调用和实现 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

下面我們探討一下關(guān)于內(nèi)存管理的系統(tǒng)調(diào)用方式。事實上,POSIX 并沒有給內(nèi)存管理指定任何的系統(tǒng)調(diào)用。然而,Linux 卻有自己的內(nèi)存系統(tǒng)調(diào)用,主要系統(tǒng)調(diào)用如下

系統(tǒng)調(diào)用描述s = brk(addr)改變數(shù)據(jù)段大小a = mmap(addr,len,prot,flags,fd,offset)進(jìn)行映射s = unmap(addr,len)取消映射

如果遇到錯誤,那么 s 的返回值是 -1,a 和 addr 是內(nèi)存地址,len 表示的是長度,prot 表示的是控制保護(hù)位,flags 是其他標(biāo)志位,fd 是文件描述符,offset 是文件偏移量。

brk 通過給出超過數(shù)據(jù)段之外的第一個字節(jié)地址來指定數(shù)據(jù)段的大小。如果新的值要比原來的大,那么數(shù)據(jù)區(qū)會變得越來越大,反之會越來越小。

mmap 和 unmap 系統(tǒng)調(diào)用會控制映射文件。mmp 的第一個參數(shù) addr 決定了文件映射的地址。它必須是頁面大小的倍數(shù)。如果參數(shù)是 0,系統(tǒng)會分配地址并返回 a。第二個參數(shù)是長度,它告訴了需要映射多少字節(jié)。它也是頁面大小的倍數(shù)。prot 決定了映射文件的保護(hù)位,保護(hù)位可以標(biāo)記為「可讀、可寫、可執(zhí)行或者這些的結(jié)合」。第四個參數(shù) flags 能夠控制文件是私有的還是可讀的以及 addr 是必須的還是只是進(jìn)行提示。第五個參數(shù) fd 是要映射的文件描述符。只有打開的文件是可以被映射的,因此如果想要進(jìn)行文件映射,必須打開文件;最后一個參數(shù) offset 會指示文件從什么時候開始,并不一定每次都要從零開始。

Linux 內(nèi)存管理實現(xiàn)

內(nèi)存管理系統(tǒng)是操作系統(tǒng)最重要的部分之一。從計算機(jī)早期開始,我們實際使用的內(nèi)存都要比系統(tǒng)中實際存在的內(nèi)存多。內(nèi)存分配策略克服了這一限制,并且其中最有名的就是 虛擬內(nèi)存(virtual memory)。通過在多個競爭的進(jìn)程之間共享虛擬內(nèi)存,虛擬內(nèi)存得以讓系統(tǒng)有更多的內(nèi)存。虛擬內(nèi)存子系統(tǒng)主要包括下面這些概念。

「大地址空間」

操作系統(tǒng)使系統(tǒng)使用起來好像比實際的物理內(nèi)存要大很多,那是因為虛擬內(nèi)存要比物理內(nèi)存大很多倍。

「保護(hù)」

系統(tǒng)中的每個進(jìn)程都會有自己的虛擬地址空間。這些虛擬地址空間彼此完全分開,因此運(yùn)行一個應(yīng)用程序的進(jìn)程不會影響另一個。并且,硬件虛擬內(nèi)存機(jī)制允許內(nèi)存保護(hù)關(guān)鍵內(nèi)存區(qū)域。

「內(nèi)存映射」

內(nèi)存映射用來向進(jìn)程地址空間映射圖像和數(shù)據(jù)文件。在內(nèi)存映射中,文件的內(nèi)容直接映射到進(jìn)程的虛擬空間中。

「公平的物理內(nèi)存分配」

內(nèi)存管理子系統(tǒng)允許系統(tǒng)中的每個正在運(yùn)行的進(jìn)程公平分配系統(tǒng)的物理內(nèi)存。

「共享虛擬內(nèi)存」

盡管虛擬內(nèi)存讓進(jìn)程有自己的內(nèi)存空間,但是有的時候你是需要共享內(nèi)存的。例如幾個進(jìn)程同時在 shell 中運(yùn)行,這會涉及到 IPC 的進(jìn)程間通信問題,這個時候你需要的是共享內(nèi)存來進(jìn)行信息傳遞而不是通過拷貝每個進(jìn)程的副本獨(dú)立運(yùn)行。

下面我們就正式探討一下什么是 虛擬內(nèi)存

虛擬內(nèi)存的抽象模型

在考慮 Linux 用于支持虛擬內(nèi)存的方法之前,考慮一個不會被太多細(xì)節(jié)困擾的抽象模型是很有用的。

處理器在執(zhí)行指令時,會從內(nèi)存中讀取指令并將其解碼(decode),在指令解碼時會獲取某個位置的內(nèi)容并將他存到內(nèi)存中。然后處理器繼續(xù)執(zhí)行下一條指令。這樣,處理器總是在訪問存儲器以獲取指令和存儲數(shù)據(jù)。

在虛擬內(nèi)存系統(tǒng)中,所有的地址空間都是虛擬的而不是物理的。但是實際存儲和提取指令的是物理地址,所以需要讓處理器根據(jù)操作系統(tǒng)維護(hù)的一張表將虛擬地址轉(zhuǎn)換為物理地址。

為了簡單的完成轉(zhuǎn)換,虛擬地址和物理地址會被分為固定大小的塊,稱為 頁(page)。這些頁有相同大小,如果頁面大小不一樣的話,那么操作系統(tǒng)將很難管理。Alpha AXP系統(tǒng)上的 Linux 使用 8 KB 頁面,而 Intel x86 系統(tǒng)上的 Linux 使用 4 KB 頁面。每個頁面都有一個唯一的編號,即頁面框架號(PFN)。

上面就是 Linux 內(nèi)存映射模型了,在這個頁模型中,虛擬地址由兩部分組成:「偏移量和虛擬頁框號」。每次處理器遇到虛擬地址時都會提取偏移量和虛擬頁框號。處理器必須將虛擬頁框號轉(zhuǎn)換為物理頁號,然后以正確的偏移量的位置訪問物理頁。

上圖中展示了兩個進(jìn)程 A 和 B 的虛擬地址空間,每個進(jìn)程都有自己的頁表。這些頁表將進(jìn)程中的虛擬頁映射到內(nèi)存中的物理頁中。頁表中每一項均包含

有效標(biāo)志(valid flag):表明此頁表條目是否有效該條目描述的物理頁框號訪問控制信息,頁面使用方式,是否可寫以及是否可以執(zhí)行代碼

要將處理器的虛擬地址映射為內(nèi)存的物理地址,首先需要計算虛擬地址的頁框號和偏移量。頁面大小為 2 的次冪,可以通過移位完成操作。

如果當(dāng)前進(jìn)程嘗試訪問虛擬地址,但是訪問不到的話,這種情況稱為 缺頁異常,此時虛擬操作系統(tǒng)的錯誤地址和頁面錯誤的原因?qū)⑼ㄖ僮飨到y(tǒng)。

通過以這種方式將虛擬地址映射到物理地址,虛擬內(nèi)存可以以任何順序映射到系統(tǒng)的物理頁面。

按需分頁

由于物理內(nèi)存要比虛擬內(nèi)存少很多,因此操作系統(tǒng)需要注意盡量避免直接使用低效的物理內(nèi)存。節(jié)省物理內(nèi)存的一種方式是僅加載執(zhí)行程序當(dāng)前使用的頁面(這何嘗不是一種懶加載的思想呢?)。例如,可以運(yùn)行數(shù)據(jù)庫來查詢數(shù)據(jù)庫,在這種情況下,不是所有的數(shù)據(jù)都裝入內(nèi)存,只裝載需要檢查的數(shù)據(jù)。這種僅僅在需要時才將虛擬頁面加載進(jìn)內(nèi)中的技術(shù)稱為按需分頁。

交換

如果某個進(jìn)程需要將虛擬頁面?zhèn)魅雰?nèi)存,但是此時沒有可用的物理頁面,那么操作系統(tǒng)必須丟棄物理內(nèi)存中的另一個頁面來為該頁面騰出空間。

如果頁面已經(jīng)修改過,那么操作系統(tǒng)必須保留該頁面的內(nèi)容,以便以后可以訪問它。這種類型的頁面被稱為臟頁,當(dāng)將其從內(nèi)存中移除時,它會保存在稱為交換文件的特殊文件中。相對于處理器和物理內(nèi)存的速度,對交換文件的訪問非常慢,并且操作系統(tǒng)需要兼顧將頁面寫到磁盤的以及將它們保留在內(nèi)存中以便再次使用。

Linux 使用最近最少使用(LRU)頁面老化技術(shù)來公平的選擇可能會從系統(tǒng)中刪除的頁面,這個方案涉及系統(tǒng)中的每個頁面,頁面的年齡隨著訪問次數(shù)的變化而變化,如果某個頁面訪問次數(shù)多,那么該頁就表示越 年輕,如果某個呃頁面訪問次數(shù)太少,那么該頁越容易被換出。

物理和虛擬尋址模式

大多數(shù)多功能處理器都支持 物理地址模式和虛擬地址模式的概念。物理尋址模式不需要頁表,并且處理器不會在此模式下嘗試執(zhí)行任何地址轉(zhuǎn)換。Linux 內(nèi)核被鏈接在物理地址空間中運(yùn)行。

Alpha AXP 處理器沒有物理尋址模式。相反,它將內(nèi)存空間劃分為幾個區(qū)域,并將其中兩個指定為物理映射的地址。此內(nèi)核地址空間稱為 KSEG 地址空間,它包含從 0xfffffc0000000000 向上的所有地址。為了從 KSEG 中鏈接的代碼(按照定義,內(nèi)核代碼)執(zhí)行或訪問其中的數(shù)據(jù),該代碼必須在內(nèi)核模式下執(zhí)行。鏈接到 Alpha 上的 Linux內(nèi)核以從地址 0xfffffc0000310000 執(zhí)行。

訪問控制

頁面表的每一項還包含訪問控制信息,訪問控制信息主要檢查進(jìn)程是否應(yīng)該訪問內(nèi)存。

必要時需要對內(nèi)存進(jìn)行訪問限制。例如包含可執(zhí)行代碼的內(nèi)存,自然是只讀內(nèi)存;操作系統(tǒng)不應(yīng)允許進(jìn)程通過其可執(zhí)行代碼寫入數(shù)據(jù)。相比之下,包含數(shù)據(jù)的頁面可以被寫入,但是嘗試執(zhí)行該內(nèi)存的指令將失敗。大多數(shù)處理器至少具有兩種執(zhí)行模式:內(nèi)核態(tài)和用戶態(tài)。你不希望訪問用戶執(zhí)行內(nèi)核代碼或內(nèi)核數(shù)據(jù)結(jié)構(gòu),除非處理器以內(nèi)核模式運(yùn)行。

訪問控制信息被保存在上面的 Page Table Entry ,頁表項中,上面這幅圖是 Alpha AXP的 PTE。位字段具有以下含義

V

表示 valid ,是否有效位

FOR

讀取時故障,在嘗試讀取此頁面時出現(xiàn)故障

FOW

寫入時錯誤,在嘗試寫入時發(fā)生錯誤

FOE

執(zhí)行時發(fā)生錯誤,在嘗試執(zhí)行此頁面中的指令時,處理器都會報告頁面錯誤并將控制權(quán)傳遞給操作系統(tǒng),

ASM

地址空間匹配,當(dāng)操作系統(tǒng)希望清除轉(zhuǎn)換緩沖區(qū)中的某些條目時,將使用此選項。

GH

當(dāng)在使用單個轉(zhuǎn)換緩沖區(qū)條目而不是多個轉(zhuǎn)換緩沖區(qū)條目映射整個塊時使用的提示。

KRE

內(nèi)核模式運(yùn)行下的代碼可以讀取頁面

URE

用戶模式下的代碼可以讀取頁面

KWE

以內(nèi)核模式運(yùn)行的代碼可以寫入頁面

UWE

以用戶模式運(yùn)行的代碼可以寫入頁面

頁框號

對于設(shè)置了 V 位的 PTE,此字段包含此 PTE 的物理頁面幀號(頁面幀號)。對于無效的 PTE,如果此字段不為零,則包含有關(guān)頁面在交換文件中的位置的信息。

除此之外,Linux 還使用了兩個位

_PAGE_DIRTY

如果已設(shè)置,則需要將頁面寫出到交換文件中

_PAGE_ACCESSED

Linux 用來將頁面標(biāo)記為已訪問。

緩存

上面的虛擬內(nèi)存抽象模型可以用來實施,但是效率不會太高。操作系統(tǒng)和處理器設(shè)計人員都嘗試提高性能。但是除了提高處理器,內(nèi)存等的速度之外,最好的方法就是維護(hù)有用信息和數(shù)據(jù)的高速緩存,從而使某些操作更快。在 Linux 中,使用很多和內(nèi)存管理有關(guān)的緩沖區(qū),使用緩沖區(qū)來提高效率。

緩沖區(qū)緩存

緩沖區(qū)高速緩存包含塊設(shè)備驅(qū)動程序使用的數(shù)據(jù)緩沖區(qū)。

還記得什么是塊設(shè)備么?這里回顧下

塊設(shè)備是一個能存儲固定大小塊信息的設(shè)備,它支持「以固定大小的塊,扇區(qū)或群集讀取和(可選)寫入數(shù)據(jù)」。每個塊都有自己的物理地址。通常塊的大小在 512 - 65536 之間。所有傳輸?shù)男畔⒍紩赃B續(xù)的塊為單位。塊設(shè)備的基本特征是每個塊都較為對立,能夠獨(dú)立的進(jìn)行讀寫。常見的塊設(shè)備有「硬盤、藍(lán)光光盤、USB 盤」

與字符設(shè)備相比,塊設(shè)備通常需要較少的引腳。

緩沖區(qū)高速緩存通過設(shè)備標(biāo)識符和塊編號用于快速查找數(shù)據(jù)塊。如果可以在緩沖區(qū)高速緩存中找到數(shù)據(jù),則無需從物理塊設(shè)備中讀取數(shù)據(jù),這種訪問方式要快得多。

頁緩存

頁緩存用于加快對磁盤上圖像和數(shù)據(jù)的訪問

它用于一次一頁地緩存文件中的內(nèi)容,并且可以通過文件和文件中的偏移量進(jìn)行訪問。當(dāng)頁面從磁盤讀入內(nèi)存時,它們被緩存在頁面緩存中。

交換區(qū)緩存

僅僅已修改(臟頁)被保存在交換文件中

只要這些頁面在寫入交換文件后沒有修改,則下次交換該頁面時,無需將其寫入交換文件,因為該頁面已在交換文件中。可以直接丟棄。在大量交換的系統(tǒng)中,這節(jié)省了許多不必要的和昂貴的磁盤操作。

硬件緩存

處理器中通常使用一種硬件緩存。頁表條目的緩存。在這種情況下,處理器并不總是直接讀取頁表,而是根據(jù)需要緩存頁的翻譯。這些是轉(zhuǎn)換后備緩沖區(qū) 也被稱為 TLB,包含來自系統(tǒng)中一個或多個進(jìn)程的頁表項的緩存副本。

引用虛擬地址后,處理器將嘗試查找匹配的 TLB 條目。如果找到,則可以將虛擬地址直接轉(zhuǎn)換為物理地址,并對數(shù)據(jù)執(zhí)行正確的操作。如果處理器找不到匹配的 TLB 條目, 它通過向操作系統(tǒng)發(fā)信號通知已發(fā)生 TLB 丟失獲得操作系統(tǒng)的支持和幫助。系統(tǒng)特定的機(jī)制用于將該異常傳遞給可以修復(fù)問題的操作系統(tǒng)代碼。操作系統(tǒng)為地址映射生成一個新的 TLB 條目。清除異常后,處理器將再次嘗試轉(zhuǎn)換虛擬地址。這次能夠執(zhí)行成功。

使用緩存也存在缺點(diǎn),為了節(jié)省精力,Linux 必須使用更多的時間和空間來維護(hù)這些緩存,并且如果緩存損壞,系統(tǒng)將會崩潰。

總結(jié)

以上是生活随笔為你收集整理的linux物理内存虚拟内存一致,Liunx内存管理的调用和实现的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。