C 实现高性能内存池
版權(quán)
一、概述
在 C/C 中,內(nèi)存管理是一個(gè)非常棘手的問題,我們在編寫一個(gè)程序的時(shí)候幾乎不可避免的要遇到內(nèi)存的分配邏輯,這時(shí)候隨之而來的有這樣一些問題:是否有足夠的內(nèi)存可供分配? 分配失敗了怎么辦? 如何管理自身的內(nèi)存使用情況? 等等一系列問題。在一個(gè)高可用的軟件中,如果我們僅僅單純的向操作系統(tǒng)去申請內(nèi)存,當(dāng)出現(xiàn)內(nèi)存不足時(shí)就退出軟件,是明顯不合理的。正確的思路應(yīng)該是在內(nèi)存不足的時(shí),考慮如何管理并優(yōu)化自身已經(jīng)使用的內(nèi)存,這樣才能使得軟件變得更加可用。本次項(xiàng)目我們將實(shí)現(xiàn)一個(gè)內(nèi)存池,并使用一個(gè)棧結(jié)構(gòu)來測試我們的內(nèi)存池提供的分配性能。最終,我們要實(shí)現(xiàn)的內(nèi)存池在棧結(jié)構(gòu)中的性能,要遠(yuǎn)高于使用 std::allocator 和 std::vector,如下圖所示:
項(xiàng)目涉及的知識點(diǎn)
C 中的內(nèi)存分配器 std::allocator
內(nèi)存池技術(shù)
手動(dòng)實(shí)現(xiàn)模板鏈?zhǔn)綏?br />鏈?zhǔn)綏:土斜項(xiàng)5男阅鼙容^
內(nèi)存池簡介
內(nèi)存池是池化技術(shù)中的一種形式。通常我們在編寫程序的時(shí)候回使用 new delete 這些關(guān)鍵字來向操作系統(tǒng)申請內(nèi)存,而這樣造成的后果就是每次申請內(nèi)存和釋放內(nèi)存的時(shí)候,都需要和操作系統(tǒng)的系統(tǒng)調(diào)用打交道,從堆中分配所需的內(nèi)存。如果這樣的操作太過頻繁,就會(huì)找成大量的內(nèi)存碎片進(jìn)而降低內(nèi)存的分配性能,甚至出現(xiàn)內(nèi)存分配失敗的情況。
而內(nèi)存池就是為了解決這個(gè)問題而產(chǎn)生的一種技術(shù)。從內(nèi)存分配的概念上看,內(nèi)存申請無非就是向內(nèi)存分配方索要一個(gè)指針,當(dāng)向操作系統(tǒng)申請內(nèi)存時(shí),操作系統(tǒng)需要進(jìn)行復(fù)雜的內(nèi)存管理調(diào)度之后,才能正確的分配出一個(gè)相應(yīng)的指針。而這個(gè)分配的過程中,我們還面臨著分配失敗的風(fēng)險(xiǎn)。
所以,每一次進(jìn)行內(nèi)存分配,就會(huì)消耗一次分配內(nèi)存的時(shí)間,設(shè)這個(gè)時(shí)間為 T,那么進(jìn)行 n 次分配總共消耗的時(shí)間就是 nT;如果我們一開始就確定好我們可能需要多少內(nèi)存,那么在最初的時(shí)候就分配好這樣的一塊內(nèi)存區(qū)域,當(dāng)我們需要內(nèi)存的時(shí)候,直接從這塊已經(jīng)分配好的內(nèi)存中使用即可,那么總共需要的分配時(shí)間僅僅只有 T。當(dāng) n 越大時(shí),節(jié)約的時(shí)間就越多。
二、主函數(shù)設(shè)計(jì)
我們要設(shè)計(jì)實(shí)現(xiàn)一個(gè)高性能的內(nèi)存池,那么自然避免不了需要對比已有的內(nèi)存,而比較內(nèi)存池對內(nèi)存的分配性能,就需要實(shí)現(xiàn)一個(gè)需要對內(nèi)存進(jìn)行動(dòng)態(tài)分配的結(jié)構(gòu)(比如:鏈表?xiàng)?#xff09;,為此,可以寫出如下的代碼:
在上面的兩段代碼中,StackAlloc 是一個(gè)鏈表?xiàng)?#xff0c;接受兩個(gè)模板參數(shù),第一個(gè)參數(shù)是棧中的元素類型,第二個(gè)參數(shù)就是棧使用的內(nèi)存分配器。
因此,這個(gè)內(nèi)存分配器的模板參數(shù)就是整個(gè)比較過程中唯一的變量,使用默認(rèn)分配器的模板參數(shù)為 std::allocator,而使用內(nèi)存池的模板參數(shù)為 MemoryPool。
std::allocator?是?C 標(biāo)準(zhǔn)庫中提供的默認(rèn)分配器,他的特點(diǎn)就在于我們在?使用?new?來申請內(nèi)存構(gòu)造新對象的時(shí)候,勢必要調(diào)用類對象的默認(rèn)構(gòu)造函數(shù),而使用?std::allocator?則可以將內(nèi)存分配和對象的構(gòu)造這兩部分邏輯給分離開來,使得分配的內(nèi)存是原始、未構(gòu)造的。1下面我們來實(shí)現(xiàn)這個(gè)鏈表?xiàng)!?/p>
三、模板鏈表?xiàng)?/p>
棧的結(jié)構(gòu)非常的簡單,沒有什么復(fù)雜的邏輯操作,其成員函數(shù)只需要考慮兩個(gè)基本的操作:入棧、出棧。為了操作上的方便,我們可能還需要這樣一些方法:判斷棧是否空、清空棧、獲得棧頂元素。
#include?template?struct?StackNode_ {T?data;StackNode_*?prev; };//?T?為存儲(chǔ)的對象類型,?Alloc?為使用的分配器,?并默認(rèn)使用?std::allocator?作為對象的分配器template?<typename?T,?typename?Alloc?=?std::allocator?>class?StackAlloc {??public:????//?使用?typedef?簡化類型名typedef?StackNode_?Node;????typedef?typename?Alloc::template?rebind::other?allocator;????//?默認(rèn)構(gòu)造StackAlloc()?{?head_?=?0;?}????//?默認(rèn)析構(gòu)~StackAlloc()?{?clear();?}????//?當(dāng)棧中元素為空時(shí)返回?truebool?empty()?{return?(head_?==?0);}????//?釋放棧中元素的所有內(nèi)存void?clear();????//?壓棧void?push(T?element);????//?出棧T?pop();????//?返回棧頂元素T?top()?{?return?(head_->data);?}??private:????//?allocator?allocator_;????//?棧頂Node*?head_; };123456789101112131415161718192021222324252627282930313233343536373839404142簡單的邏輯諸如構(gòu)造、析構(gòu)、判斷棧是否空、返回棧頂元素的邏輯都非常簡單,直接在上面的定義中實(shí)現(xiàn)了,下面我們來實(shí)現(xiàn) clear(), push() 和 pop() 這三個(gè)重要的邏輯:
//?釋放棧中元素的所有內(nèi)存void?clear()?{Node*?curr?=?head_;??//?依次出棧while?(curr?!=?0){Node*?tmp?=?curr->prev;????//?先析構(gòu),?再回收內(nèi)存allocator_.destroy(curr);allocator_.deallocate(curr,?1);curr?=?tmp;}head_?=?0; }//?入棧void?push(T?element)?{??//?為一個(gè)節(jié)點(diǎn)分配內(nèi)存Node*?newNode?=?allocator_.allocate(1);??//?調(diào)用節(jié)點(diǎn)的構(gòu)造函數(shù)allocator_.construct(newNode,?Node());??//?入棧操作newNode->data?=?element;newNode->prev?=?head_;head_?=?newNode; }//?出棧T?pop()?{??//?出棧操作?返回出棧元素T?result?=?head_->data;Node*?tmp?=?head_->prev;allocator_.destroy(head_);allocator_.deallocate(head_,?1);head_?=?tmp;??return?result; }12345678910111213141516171819202122232425262728293031323334353637至此,我們完成了整個(gè)模板鏈表?xiàng)?#xff0c;現(xiàn)在我們可以先注釋掉 main() 函數(shù)中使用內(nèi)存池部分的代碼來測試這個(gè)連表?xiàng)5膬?nèi)存分配情況,我們就能夠得到這樣的結(jié)果:
在使用 std::allocator 的默認(rèn)內(nèi)存分配器中,在
#define?ELEMS?10000000#define?REPS?10012的條件下,總共花費(fèi)了近一分鐘的時(shí)間。
如果覺得花費(fèi)的時(shí)間較長,不愿等待,則你嘗試可以減小這兩個(gè)值1總結(jié)
本節(jié)我們實(shí)現(xiàn)了一個(gè)用于測試性能比較的模板鏈表?xiàng)?#xff0c;目前的代碼如下。在下一節(jié)中,我們開始詳細(xì)實(shí)現(xiàn)我們的高性能內(nèi)存池。
//?StackAlloc.hpp#ifndef?STACK_ALLOC_H#define?STACK_ALLOC_H#include?template?struct?StackNode_ {T?data;StackNode_*?prev; };//?T?為存儲(chǔ)的對象類型,?Alloc?為使用的分配器,//?并默認(rèn)使用?std::allocator?作為對象的分配器template?<class?T,?class?Alloc?=?std::allocator?>class?StackAlloc {??public:????//?使用?typedef?簡化類型名typedef?StackNode_?Node;????typedef?typename?Alloc::template?rebind::other?allocator;????//?默認(rèn)構(gòu)造StackAlloc()?{?head_?=?0;?}????//?默認(rèn)析構(gòu)~StackAlloc()?{?clear();?}????//?當(dāng)棧中元素為空時(shí)返回?truebool?empty()?{return?(head_?==?0);}????//?釋放棧中元素的所有內(nèi)存void?clear()?{Node*?curr?=?head_;??????while?(curr?!=?0){Node*?tmp?=?curr->prev;allocator_.destroy(curr);allocator_.deallocate(curr,?1);curr?=?tmp;}head_?=?0;}????//?入棧void?push(T?element)?{??????//?為一個(gè)節(jié)點(diǎn)分配內(nèi)存Node*?newNode?=?allocator_.allocate(1);??????//?調(diào)用節(jié)點(diǎn)的構(gòu)造函數(shù)allocator_.construct(newNode,?Node());??????//?入棧操作newNode->data?=?element;newNode->prev?=?head_;head_?=?newNode;}????//?出棧T?pop()?{??????//?出棧操作?返回出棧結(jié)果T?result?=?head_->data;Node*?tmp?=?head_->prev;allocator_.destroy(head_);allocator_.deallocate(head_,?1);head_?=?tmp;??????return?result;}????//?返回棧頂元素T?top()?{?return?(head_->data);?}??private:allocator?allocator_;Node*?head_; };#endif?//?STACK_ALLOC_H123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778//?main.cpp#include?#include?#include?#include?//?#include?"MemoryPool.hpp"#include?"StackAlloc.hpp"//?根據(jù)電腦性能調(diào)整這些值//?插入元素個(gè)數(shù)#define?ELEMS?25000000//?重復(fù)次數(shù)#define?REPS?50int?main() {clock_t?start;????//?使用默認(rèn)分配器StackAlloc<int,?std::allocator?>?stackDefault;start?=?clock();????for?(int?j?=?0;?j?<?REPS;?j )?{assert(stackDefault.empty());????????for?(int?i?=?0;?i?<?ELEMS;?i )stackDefault.push(i);????????for?(int?i?=?0;?i?<?ELEMS;?i )stackDefault.pop();}????std::cout?<<?"Default?Allocator?Time:?";????std::cout?<<?(((double)clock()?-?start)?/?CLOCKS_PER_SEC)?<<?"\n\n";????//?使用內(nèi)存池//?StackAlloc<int,?MemoryPool?>?stackPool;//?start?=?clock();//?for?(int?j?=?0;?j?<?REPS;?j )?{//?????assert(stackPool.empty());//?????for?(int?i?=?0;?i?<?ELEMS;?i )//???????stackPool.push(i);//?????for?(int?i?=?0;?i?<?ELEMS;?i )//???????stackPool.pop();//?}//?std::cout?<<?"MemoryPool?Allocator?Time:?";//?std::cout?<<?(((double)clock()?-?start)?/?CLOCKS_PER_SEC)?<<?"\n\n";return?0; }123456789101112131415161718192021222324252627282930313233343536373839404142434445464748二、設(shè)計(jì)內(nèi)存池
在上一節(jié)實(shí)驗(yàn)中,我們在模板鏈表?xiàng)V惺褂昧四J(rèn)構(gòu)造器來管理?xiàng)2僮髦械脑貎?nèi)存,一共涉及到了 rebind::other, allocate(), dealocate(), construct(), destroy()這些關(guān)鍵性的接口。所以為了讓代碼直接可用,我們同樣應(yīng)該在內(nèi)存池中設(shè)計(jì)同樣的接口:
在上面的類設(shè)計(jì)中可以看到,在這個(gè)內(nèi)存池中,其實(shí)是使用鏈表來管理整個(gè)內(nèi)存池的內(nèi)存區(qū)塊的。內(nèi)存池首先會(huì)定義固定大小的基本內(nèi)存區(qū)塊(Block),然后在其中定義了一個(gè)可以實(shí)例化為存放對象內(nèi)存槽的對象槽(Slot_)和對象槽指針的一個(gè)聯(lián)合。然后在區(qū)塊中,定義了四個(gè)關(guān)鍵性質(zhì)的指針,它們的作用分別是:
currentBlock_: 指向當(dāng)前內(nèi)存區(qū)塊的指針
currentSlot_: 指向當(dāng)前內(nèi)存區(qū)塊中的對象槽
lastSlot_: 指向當(dāng)前內(nèi)存區(qū)塊中的最后一個(gè)對象槽
freeSlots_: 指向當(dāng)前內(nèi)存區(qū)塊中所有空閑的對象槽
梳理好整個(gè)內(nèi)存池的設(shè)計(jì)結(jié)構(gòu)之后,我們就可以開始實(shí)現(xiàn)關(guān)鍵性的邏輯了。
三、實(shí)現(xiàn)
MemoryPool::construct() 實(shí)現(xiàn)
MemoryPool::construct() 的邏輯是最簡單的,我們需要實(shí)現(xiàn)的,僅僅只是調(diào)用信件對象的構(gòu)造函數(shù)即可,因此:
//?調(diào)用構(gòu)造函數(shù),?使用?std::forward?轉(zhuǎn)發(fā)變參模板 template?<typename?U,?typename...?Args> void?construct(U*?p,?Args&&...?args)?{new?(p)?U?(std::forward(args)...); }12345MemoryPool::deallocate() 實(shí)現(xiàn)
MemoryPool::deallocate() 是在對象槽中的對象被析構(gòu)后才會(huì)被調(diào)用的,主要目的是銷毀內(nèi)存槽。其邏輯也不復(fù)雜:
//?銷毀指針?p?指向的內(nèi)存區(qū)塊void?deallocate(pointer?p,?size_t?n?=?1)?{??if?(p?!=?nullptr)?{????//?reinterpret_cast?是強(qiáng)制類型轉(zhuǎn)換符//?要訪問?next?必須強(qiáng)制將?p?轉(zhuǎn)成?slot_pointer_reinterpret_cast(p)->next?=?freeSlots_;freeSlots_?=?reinterpret_cast(p);} }123456789MemoryPool::~MemoryPool() 實(shí)現(xiàn)
析構(gòu)函數(shù)負(fù)責(zé)銷毀整個(gè)內(nèi)存池,因此我們需要逐個(gè)刪除掉最初向操作系統(tǒng)申請的內(nèi)存塊:
//?銷毀一個(gè)現(xiàn)有的內(nèi)存池~MemoryPool()?noexcept?{??//?循環(huán)銷毀內(nèi)存池中分配的內(nèi)存區(qū)塊slot_pointer_?curr?=?currentBlock_;??while?(curr?!=?nullptr)?{slot_pointer_?prev?=?curr->next;????operator?delete(reinterpret_cast(curr));curr?=?prev;} }12345678910MemoryPool::allocate() 實(shí)現(xiàn)
MemoryPool::allocate() 毫無疑問是整個(gè)內(nèi)存池的關(guān)鍵所在,但實(shí)際上理清了整個(gè)內(nèi)存池的設(shè)計(jì)之后,其實(shí)現(xiàn)并不復(fù)雜。具體實(shí)現(xiàn)如下:
//?同一時(shí)間只能分配一個(gè)對象,?n?和?hint?會(huì)被忽略pointer?allocate(size_t?n?=?1,?const?T*?hint?=?0)?{??//?如果有空閑的對象槽,那么直接將空閑區(qū)域交付出去if?(freeSlots_?!=?nullptr)?{pointer?result?=?reinterpret_cast(freeSlots_);freeSlots_?=?freeSlots_->next;????return?result;}?else?{????//?如果對象槽不夠用了,則分配一個(gè)新的內(nèi)存區(qū)塊if?(currentSlot_?>=?lastSlot_)?{??????//?分配一個(gè)新的內(nèi)存區(qū)塊,并指向前一個(gè)內(nèi)存區(qū)塊data_pointer_?newBlock?=?reinterpret_cast(operator?new(BlockSize));??????reinterpret_cast(newBlock)->next?=?currentBlock_;currentBlock_?=?reinterpret_cast(newBlock);??????//?填補(bǔ)整個(gè)區(qū)塊來滿足元素內(nèi)存區(qū)域的對齊要求data_pointer_?body?=?newBlock? ?sizeof(slot_pointer_);uintptr_t?result?=?reinterpret_cast(body);size_t?bodyPadding?=?(alignof(slot_type_)?-?result)?%?alignof(slot_type_);currentSlot_?=?reinterpret_cast(body? ?bodyPadding);lastSlot_?=?reinterpret_cast(newBlock? ?BlockSize?-?sizeof(slot_type_)? ?1);}????return?reinterpret_cast(currentSlot_ );} }123456789101112131415161718192021222324四、與 std::vector 的性能對比
我們知道,對于棧來說,鏈棧其實(shí)并不是最好的實(shí)現(xiàn)方式,因?yàn)檫@種結(jié)構(gòu)的棧不可避免的會(huì)涉及到指針相關(guān)的操作,同時(shí),還會(huì)消耗一定量的空間來存放節(jié)點(diǎn)之間的指針。事實(shí)上,我們可以使用 std::vector 中的 push_back() 和 pop_back() 這兩個(gè)操作來模擬一個(gè)棧,我們不妨來對比一下這個(gè) std::vector 與我們所實(shí)現(xiàn)的內(nèi)存池在性能上誰高誰低,我們在 主函數(shù)中加入如下代碼:
//?比較內(nèi)存池和?std::vector?之間的性能std::vector?stackVector;start?=?clock();????for?(int?j?=?0;?j?<?REPS;?j )?{assert(stackVector.empty());????????for?(int?i?=?0;?i?<?ELEMS;?i )stackVector.push_back(i);????????for?(int?i?=?0;?i?<?ELEMS;?i )stackVector.pop_back();}????std::cout?<<?"Vector?Time:?";????std::cout?<<?(((double)clock()?-?start)?/?CLOCKS_PER_SEC)?<<?"\n\n";123456789101112這時(shí)候,我們重新編譯代碼,就能夠看出這里面的差距了:
首先是使用默認(rèn)分配器的鏈表?xiàng)K俣茸盥?#xff0c;其次是使用 std::vector 模擬的棧結(jié)構(gòu),在鏈表?xiàng)5幕A(chǔ)上大幅度削減了時(shí)間。
最后,對于我們實(shí)現(xiàn)的內(nèi)存池,消耗的時(shí)間最少,即內(nèi)存分配性能最佳,完成了本項(xiàng)目。
總結(jié)
本節(jié)中,我們實(shí)現(xiàn)了我們上節(jié)實(shí)驗(yàn)中未實(shí)現(xiàn)的內(nèi)存池,完成了整個(gè)項(xiàng)目的目標(biāo)。 這個(gè)內(nèi)存池不僅精簡而且高效,整個(gè)內(nèi)存池的完整代碼如下:
#ifndef?MEMORY_POOL_HPP#define?MEMORY_POOL_HPP#include?#include?template?<typename?T,?size_t?BlockSize?=?4096>class?MemoryPool {??public:????//?使用?typedef?簡化類型書寫typedef?T*??????????????pointer;????//?定義?rebind::other?接口template??struct?rebind?{??????typedef?MemoryPool?other;};????//?默認(rèn)構(gòu)造//?C 11?使用了?noexcept?來顯式的聲明此函數(shù)不會(huì)拋出異常MemoryPool()?noexcept?{currentBlock_?=?nullptr;currentSlot_?=?nullptr;lastSlot_?=?nullptr;freeSlots_?=?nullptr;}????//?銷毀一個(gè)現(xiàn)有的內(nèi)存池~MemoryPool()?noexcept?{??????//?循環(huán)銷毀內(nèi)存池中分配的內(nèi)存區(qū)塊slot_pointer_?curr?=?currentBlock_;??????while?(curr?!=?nullptr)?{slot_pointer_?prev?=?curr->next;????????operator?delete(reinterpret_cast(curr));curr?=?prev;}}????//?同一時(shí)間只能分配一個(gè)對象,?n?和?hint?會(huì)被忽略pointer?allocate(size_t?n?=?1,?const?T*?hint?=?0)?{??????if?(freeSlots_?!=?nullptr)?{pointer?result?=?reinterpret_cast(freeSlots_);freeSlots_?=?freeSlots_->next;????????return?result;}??????else?{????????if?(currentSlot_?>=?lastSlot_)?{??????????//?分配一個(gè)內(nèi)存區(qū)塊data_pointer_?newBlock?=?reinterpret_cast(operator?new(BlockSize));??????????reinterpret_cast(newBlock)->next?=?currentBlock_;currentBlock_?=?reinterpret_cast(newBlock);data_pointer_?body?=?newBlock? ?sizeof(slot_pointer_);uintptr_t?result?=?reinterpret_cast(body);size_t?bodyPadding?=?(alignof(slot_type_)?-?result)?%?alignof(slot_type_);currentSlot_?=?reinterpret_cast(body? ?bodyPadding);lastSlot_?=?reinterpret_cast(newBlock? ?BlockSize?-?sizeof(slot_type_)? ?1);}????????return?reinterpret_cast(currentSlot_ );}}????//?銷毀指針?p?指向的內(nèi)存區(qū)塊void?deallocate(pointer?p,?size_t?n?=?1)?{??????if?(p?!=?nullptr)?{????????reinterpret_cast(p)->next?=?freeSlots_;freeSlots_?=?reinterpret_cast(p);}}????//?調(diào)用構(gòu)造函數(shù),?使用?std::forward?轉(zhuǎn)發(fā)變參模板template?<typename?U,?typename...?Args>????void?construct(U*?p,?Args&&...?args)?{??????new?(p)?U?(std::forward(args)...);}????//?銷毀內(nèi)存池中的對象,?即調(diào)用對象的析構(gòu)函數(shù)template?????void?destroy(U*?p)?{p->~U();}??private:????//?用于存儲(chǔ)內(nèi)存池中的對象槽union?Slot_?{T?element;Slot_*?next;};????//?數(shù)據(jù)指針typedef?char*?data_pointer_;????//?對象槽typedef?Slot_?slot_type_;????//?對象槽指針typedef?Slot_*?slot_pointer_;????//?指向當(dāng)前內(nèi)存區(qū)塊slot_pointer_?currentBlock_;????//?指向當(dāng)前內(nèi)存區(qū)塊的一個(gè)對象槽slot_pointer_?currentSlot_;????//?指向當(dāng)前內(nèi)存區(qū)塊的最后一個(gè)對象槽slot_pointer_?lastSlot_;????//?指向當(dāng)前內(nèi)存區(qū)塊中的空閑對象槽slot_pointer_?freeSlots_;????//?檢查定義的內(nèi)存池大小是否過小static_assert(BlockSize?>=?2?*?sizeof(slot_type_),?"BlockSize?too?small."); };#endif?//?MEMORY_POOL_HPP總結(jié)
以上是生活随笔為你收集整理的C 实现高性能内存池的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 安卓8.0 9.0(安卓8.0 ldac
- 下一篇: C语言 -- 字符串中根据特定字符(串)