當前位置：首頁 >

CPU缓存一致性协议MESI - 笔记

發(fā)布時間：2024/2/28 40 豆豆

生活随笔收集整理的這篇文章主要介紹了 CPU缓存一致性协议MESI - 笔记小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

CPU緩存一致性協(xié)議MESI

CPU高速緩存（Cache Memory）

CPU為何要有高速緩存

CPU在摩爾定律的指導(dǎo)下以每18個月翻一番的速度在發(fā)展，然而內(nèi)存和硬盤的發(fā)展速度遠遠不及CPU。這就造成了高性能能的內(nèi)存和硬盤價格及其昂貴。然而CPU的高度運算需要高速的數(shù)據(jù)。為了解決這個問題，CPU廠商在CPU中內(nèi)置了少量的高速緩存以解決I\O速度和CPU運算速度之間的不匹配問題。

在CPU訪問存儲設(shè)備時，無論是存取數(shù)據(jù)抑或存取指令，都趨于聚集在一片連續(xù)的區(qū)域中，這就被稱為局部性原理。

時間局部性（Temporal Locality）：如果一個信息項正在被訪問，那么在近期它很可能還會被再次訪問。

比如循環(huán)、遞歸、方法的反復(fù)調(diào)用等。

空間局部性（Spatial Locality）：如果一個存儲器的位置被引用，那么將來他附近的位置也會被引用。

比如順序執(zhí)行的代碼、連續(xù)創(chuàng)建的兩個對象、數(shù)組等。

帶有高速緩存的CPU執(zhí)行計算的流程

程序以及數(shù)據(jù)被加載到主內(nèi)存

指令和數(shù)據(jù)被加載到CPU的高速緩存

CPU執(zhí)行指令，把結(jié)果寫到高速緩存

高速緩存中的數(shù)據(jù)寫回主內(nèi)存

目前流行的多級緩存結(jié)構(gòu)

由于CPU的運算速度超越了1級緩存的數(shù)據(jù)I\O能力，CPU廠商又引入了多級的緩存結(jié)構(gòu)。

多級緩存結(jié)構(gòu)

多核CPU多級緩存一致性協(xié)議MESI

多核CPU的情況下有多個一級緩存，如何保證緩存內(nèi)部數(shù)據(jù)的一致,不讓系統(tǒng)數(shù)據(jù)混亂。這里就引出了一個一致性的協(xié)議MESI。

MESI協(xié)議緩存狀態(tài)

MESI 是指4中狀態(tài)的首字母。每個Cache line有4個狀態(tài)，可用2個bit表示，它們分別是：

緩存行（Cache line）:緩存存儲數(shù)據(jù)的單元。

狀態(tài)	描述	監(jiān)聽任務(wù)
M 修改 (Modified)	該Cache line有效，數(shù)據(jù)被修改了，和內(nèi)存中的數(shù)據(jù)不一致，數(shù)據(jù)只存在于本Cache中。	緩存行必須時刻監(jiān)聽所有試圖讀該緩存行相對就主存的操作，這種操作必須在緩存將該緩存行寫回主存并將狀態(tài)變成S（共享）狀態(tài)之前被延遲執(zhí)行。
E 獨享、互斥 (Exclusive)	該Cache line有效，數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致，數(shù)據(jù)只存在于本Cache中。	緩存行也必須監(jiān)聽其它緩存讀主存中該緩存行的操作，一旦有這種操作，該緩存行需要變成S（共享）狀態(tài)。
S 共享 (Shared)	該Cache line有效，數(shù)據(jù)和內(nèi)存中的數(shù)據(jù)一致，數(shù)據(jù)存在于很多Cache中。	緩存行也必須監(jiān)聽其它緩存使該緩存行無效或者獨享該緩存行的請求，并將該緩存行變成無效（Invalid）。
I 無效 (Invalid)	該Cache line無效。	無

注意：

對于M和E狀態(tài)而言總是精確的，他們在和該緩存行的真正狀態(tài)是一致的，而S狀態(tài)可能是非一致的。如果一個緩存將處于S狀態(tài)的緩存行作廢了，而另一個緩存實際上可能已經(jīng)獨享了該緩存行，但是該緩存卻不會將該緩存行升遷為E狀態(tài)，這是因為其它緩存不會廣播他們作廢掉該緩存行的通知，同樣由于緩存并沒有保存該緩存行的copy的數(shù)量，因此（即使有這種通知）也沒有辦法確定自己是否已經(jīng)獨享了該緩存行。

從上面的意義看來E狀態(tài)是一種投機性的優(yōu)化：如果一個CPU想修改一個處于S狀態(tài)的緩存行，總線事務(wù)需要將所有該緩存行的copy變成invalid狀態(tài)，而修改E狀態(tài)的緩存不需要使用總線事務(wù)。

MESI狀態(tài)轉(zhuǎn)換

理解該圖的前置說明：

1.觸發(fā)事件

觸發(fā)事件	描述
本地讀取（Local read）	本地cache讀取本地cache數(shù)據(jù)
本地寫入（Local write）	本地cache寫入本地cache數(shù)據(jù)
遠端讀取（Remote read）	其他cache讀取本地cache數(shù)據(jù)
遠端寫入（Remote write）	其他cache寫入本地cache數(shù)據(jù)

2.cache分類：

前提：所有的cache共同緩存了主內(nèi)存中的某一條數(shù)據(jù)。

本地cache:指當前cpu的cache。

觸發(fā)cache:觸發(fā)讀寫事件的cache。

其他cache:指既除了以上兩種之外的cache。

注意：本地的事件觸發(fā) 本地cache和觸發(fā)cache為相同。

上圖的切換解釋：

狀態(tài)

觸發(fā)本地讀取

觸發(fā)本地寫入

觸發(fā)遠端讀取

觸發(fā)遠端寫入

M狀態(tài)（修改）

本地cache:M?

觸發(fā)cache:M

其他cache:I

本地cache:M?

觸發(fā)cache:M

其他cache:I

本地cache:M→E→S

觸發(fā)cache:I→S

其他cache:I→S

同步主內(nèi)存后修改為E獨享,同步觸發(fā)、其他cache后本地、觸發(fā)、其他cache修改為S共享

本地cache:M→E→S→I

觸發(fā)cache:I→S→E→M

其他cache:I→S→I

同步和讀取一樣,同步完成后觸發(fā)cache改為M，本地、其他cache改為I

E狀態(tài)（獨享）

本地cache:E

觸發(fā)cache:E

其他cache:I

本地cache:E→M

觸發(fā)cache:E→M

其他cache:I

本地cache變更為M,其他cache狀態(tài)應(yīng)當是I（無效）

本地cache:E→S

觸發(fā)cache:I→S

其他cache:I→S

當其他cache要讀取該數(shù)據(jù)時，其他、觸發(fā)、本地cache都被設(shè)置為S(共享)

本地cache:E→S→I

觸發(fā)cache:I→S→E→M

其他cache:I→S→I

當觸發(fā)cache修改本地cache獨享數(shù)據(jù)時時，將本地、觸發(fā)、其他cache修改為S共享.然后觸發(fā)cache修改為獨享，其他、本地cache修改為I（無效），觸發(fā)cache再修改為M

S狀態(tài)(共享)

本地cache:S

觸發(fā)cache:S

其他cache:S

本地cache:S→E→M

觸發(fā)cache:S→E→M

其他cache:S→I?

當本地cache修改時，將本地cache修改為E,其他cache修改為I,然后再將本地cache為M狀態(tài)

本地cache:S

觸發(fā)cache:S

其他cache:S

本地cache:S→I

觸發(fā)cache：S→E→M

其他cache:S→I

當觸發(fā)cache要修改本地共享數(shù)據(jù)時，觸發(fā)cache修改為E（獨享）,本地、其他cache修改為I（無效）,觸發(fā)cache再次修改為M(修改)

I狀態(tài)（無效）

本地cache:I→S或者I→E

觸發(fā)cache:I→S或者I →E

其他cache:E、M、I→S、I

本地、觸發(fā)cache將從I無效修改為S共享或者E獨享，其他cache將從E、M、I 變?yōu)镾或者I

本地cache:I→S→E→M

觸發(fā)cache:I→S→E→M

其他cache:M、E、S→S→I

既然是本cache是I，其他cache操作與它無關(guān)

下圖示意了，當一個cache line的調(diào)整的狀態(tài)的時候，另外一個cache line 需要調(diào)整的狀態(tài)。

?	M	E	S	I
M	×	×	×	√
E	×	×	×	√
S	×	×	√	√
I	√	√	√	√

舉個栗子來說：

假設(shè)cache 1 中有一個變量x = 0的cache line 處于S狀態(tài)(共享)。

那么其他擁有x變量的cache 2、cache 3等x的cache line調(diào)整為S狀態(tài)（共享）或者調(diào)整為 I 狀態(tài)（無效）。

多核緩存協(xié)同操作

假設(shè)有三個CPU A、B、C，對應(yīng)三個緩存分別是cache a、b、 c。在主內(nèi)存中定義了x的引用值為0。

單核讀取

那么執(zhí)行流程是：

CPU A發(fā)出了一條指令，從主內(nèi)存中讀取x。

從主內(nèi)存通過bus讀取到緩存中（遠端讀取Remote read）,這是該Cache line修改為E狀態(tài)（獨享）.

雙核讀取

那么執(zhí)行流程是：

CPU A發(fā)出了一條指令，從主內(nèi)存中讀取x。

CPU A從主內(nèi)存通過bus讀取到 cache a中并將該cache line 設(shè)置為E狀態(tài)。

CPU B發(fā)出了一條指令，從主內(nèi)存中讀取x。

CPU B試圖從主內(nèi)存中讀取x時，CPU A檢測到了地址沖突。這時CPU A對相關(guān)數(shù)據(jù)做出響應(yīng)。此時x 存儲于cache a和cache b中，x在chche a和cache b中都被設(shè)置為S狀態(tài)(共享)。

修改數(shù)據(jù)

那么執(zhí)行流程是：

CPU A 計算完成后發(fā)指令需要修改x.

CPU A 將x設(shè)置為M狀態(tài)（修改）并通知緩存了x的CPU B, CPU B將本地cache b中的x設(shè)置為I狀態(tài)(無效)

CPU A 對x進行賦值。

同步數(shù)據(jù)

那么執(zhí)行流程是：

CPU B 發(fā)出了要讀取x的指令。

CPU B 通知CPU A,CPU A將修改后的數(shù)據(jù)同步到主內(nèi)存時cache a 修改為E（獨享）

CPU A同步CPU B的x,將cache a和同步后cache b中的x設(shè)置為S狀態(tài)（共享）。

MESI優(yōu)化和他們引入的問題

緩存的一致性消息傳遞是要時間的，這就使其切換時會產(chǎn)生延遲。當一個緩存被切換狀態(tài)時其他緩存收到消息完成各自的切換并且發(fā)出回應(yīng)消息這么一長串的時間中CPU都會等待所有緩存響應(yīng)完成。可能出現(xiàn)的阻塞都會導(dǎo)致各種各樣的性能問題和穩(wěn)定性問題。

CPU切換狀態(tài)阻塞解決-存儲緩存（Store Bufferes）

比如你需要修改本地緩存中的一條信息，那么你必須將I（無效）狀態(tài)通知到其他擁有該緩存數(shù)據(jù)的CPU緩存中，并且等待確認。等待確認的過程會阻塞處理器，這會降低處理器的性能。應(yīng)為這個等待遠遠比一個指令的執(zhí)行時間長的多。

Store Bufferes

為了避免這種CPU運算能力的浪費，Store Bufferes被引入使用。處理器把它想要寫入到主存的值寫到緩存，然后繼續(xù)去處理其他事情。當所有失效確認（Invalidate Acknowledge）都接收到時，數(shù)據(jù)才會最終被提交。

這么做有兩個風(fēng)險

Store Bufferes的風(fēng)險

第一、就是處理器會嘗試從存儲緩存（Store buffer）中讀取值，但它還沒有進行提交。這個的解決方案稱為Store Forwarding，它使得加載的時候，如果存儲緩存中存在，則進行返回。

第二、保存什么時候會完成，這個并沒有任何保證。

value = 3；void exeToCPUA(){?? value = 10;?? isFinsh = true; }void exeToCPUB(){?? if(isFinsh){???? //value一定等于10？！???? assert value == 10;?? } }

試想一下開始執(zhí)行時，CPU A保存著finished在E(獨享)狀態(tài)，而value并沒有保存在它的緩存中。（例如，Invalid）。在這種情況下，value會比finished更遲地拋棄存儲緩存。完全有可能CPU B讀取finished的值為true，而value的值不等于10。

即isFinsh的賦值在value賦值之前。

這種在可識別的行為中發(fā)生的變化稱為重排序（reordings）。注意，這不意味著你的指令的位置被惡意（或者好意）地更改。

它只是意味著其他的CPU會讀到跟程序中寫入的順序不一樣的結(jié)果。

順便提一下NIO的設(shè)計和Store Bufferes的設(shè)計是非常相像的。

硬件內(nèi)存模型

執(zhí)行失效也不是一個簡單的操作，它需要處理器去處理。另外，存儲緩存（Store Buffers）并不是無窮大的，所以處理器有時需要等待失效確認的返回。這兩個操作都會使得性能大幅降低。為了應(yīng)付這種情況，引入了失效隊列。它們的約定如下：

對于所有的收到的Invalidate請求，Invalidate Acknowlege消息必須立刻發(fā)送

Invalidate并不真正執(zhí)行，而是被放在一個特殊的隊列中，在方便的時候才會去執(zhí)行。

處理器不會發(fā)送任何消息給所處理的緩存條目，直到它處理Invalidate。

即便是這樣處理器已然不知道什么時候優(yōu)化是允許的，而什么時候并不允許。

干脆處理器將這個任務(wù)丟給了寫代碼的人。這就是內(nèi)存屏障（Memory Barriers）。

寫屏障 Store Memory Barrier(a.k.a. ST, SMB, smp_wmb)是一條告訴處理器在執(zhí)行這之后的指令之前，應(yīng)用所有已經(jīng)在存儲緩存（store buffer）中的保存的指令。

讀屏障Load Memory Barrier (a.k.a. LD, RMB, smp_rmb)是一條告訴處理器在執(zhí)行任何的加載前，先應(yīng)用所有已經(jīng)在失效隊列中的失效操作的指令。

void executedOnCpu0() {value = 10;//在更新數(shù)據(jù)之前必須將所有存儲緩存（store buffer）中的指令執(zhí)行完畢。storeMemoryBarrier();finished = true; } void executedOnCpu1() {while(!finished);//在讀取之前將所有失效隊列中關(guān)于該數(shù)據(jù)的指令執(zhí)行完畢。loadMemoryBarrier();assert value == 10; }

總結(jié)

以上是生活随笔為你收集整理的CPU缓存一致性协议MESI - 笔记的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Alibaba微服务事务Seata源码深
下一篇：面试盲区TCP/SOCKET/三次握手

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

CPU缓存一致性协议MESI - 笔记

CPU緩存一致性協(xié)議MESI

CPU高速緩存（Cache Memory）

帶有高速緩存的CPU執(zhí)行計算的流程

目前流行的多級緩存結(jié)構(gòu)

多核CPU多級緩存一致性協(xié)議MESI

MESI協(xié)議緩存狀態(tài)

注意：

MESI狀態(tài)轉(zhuǎn)換

多核緩存協(xié)同操作

單核讀取

雙核讀取

修改數(shù)據(jù)

同步數(shù)據(jù)

MESI優(yōu)化和他們引入的問題

CPU切換狀態(tài)阻塞解決-存儲緩存（Store Bufferes）

Store Bufferes

Store Bufferes的風(fēng)險

硬件內(nèi)存模型

總結(jié)