色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

原子操作有多慢?為什么需要MESI?

Linux閱碼場 ? 來源:Linux閱碼場 ? 2023-03-23 17:07 ? 次閱讀

一、來自于霍金的難題

據說斯蒂芬·霍金曾經聲稱半導體制造商面臨兩個基本問題:

(1)有限的光速

(2)物質的原子本質

第一個難題,決定了在一個CPU周期內,電信號無法在整個系統所有CPU中廣播。換句話說,某個CPU指令對一個內存地址的寫操作,不會在這條指令執行完畢后,馬上被其他CPU識別到操作結果。例如:CPU0對全局變量foo執行foo = 1,當CPU 0執行完相應的匯編代碼后,其他CPU核仍然看到foo賦值前的值。剛接觸操作系統的讀者,需要注意這一點。

第二個難題,導致我們至少需要一個原子來存儲二進制位。沒有辦法在一個原子中存儲一個字、一段內存、一個完整的寄存器內容......最終的結果是,硬件工程師沒有辦法縮小芯片流片面積。當CPU核心增加時,核間通信的負擔會變得更加沉重。

當然,作為理論物理學家,霍金的這兩個問題都是理論性的。半導體制造商很有可能已經逼近這兩個限制。雖然如此,還是有一些研發報告關注于如何規避這兩個基本限制。

其中一個繞開物質原子本質的辦法是一種稱為“high-K絕緣體”的材料,這種材料允許較大的器件模擬超小型器件的電氣屬性。這種材料存在一些重大的生產困難,但是總算能將研究的前沿再推進一步。另一個比較奇異的解決方法是在單個電子上存儲多個比特位,這是建立在單個電子可以同時存在于多個能級的現象之上。不過這種方法還有待觀察,才能確定能否在產品級的半導體設備中穩定工作。

還有一種稱為“量子點”的解決方法,使得可以制造體積小得多的半導體設備,不過該方法還處于研究階段。

第一個限制不容易被繞過,雖然量子技術、甚至弦論,理論上允許通信速度超過光速。但是這僅僅是理論研究,實際工程中還未應用。

二、原子操作有多慢?

這里的原子操作,是特指Linux內核中,類似于atomic_long_add_return這樣的API。簡單的說,就是當某個原子操作完成時,確保所有CPU核已經識別到對原子變量的修改,并且在原子操作期間,其他CPU核不會同步對該變量進行修改。這必然要求相應的電信號在所有的CPU之間廣播。如下圖:

poYBAGQcFvOAA4lMAAEIsEsq_Oc029.jpg

對于普通變量操作(非原子操作)來說,電信號則不必在所有CPU核之間傳播并來回傳遞:

poYBAGQcFwWADr6PAAElf0d_SDc072.jpg

不能忘記一點:Linux操作系統可以運行在超過1024個CPU的大型系統中。在這些大型系統中,在所有CPU之間廣播傳遞電信號,需要花費“很長”的時間。

但是,很長究竟是多長?

poYBAGQcFxyAEAufAAFTxV0vr2k931.jpg

在上表中,一次“CAS cache miss”的CPU周期是266,夠長了吧?而這個測試結果,是在比較新的、4核CPU的多核系統中進行的。在老一點的系統中,或者在更多CPU核心的系統中,這個時間更長。

三、變量可以擁有多個值

這不是天方夜譚。

假設CPU 0向全局變量foo寫入一個值1,我們會很自然的認為:其他CPU會立即識別到foo的值為1。即使有所疑惑,我們可能也會退一步認為,在稍后某個時刻,其他“所有”CPU都會“同時”識別到foo的值為1。而不會出現一種奇怪的現象:在某個時刻,CPU 1識別到其值為1,而CPU 2識別到其值為0。不幸的是,是時候告別這種想法了。并行計算就是這么神奇和反直覺。如果不能理解這一點,就沒辦法真正理解RCU。

要明白這一點,考慮下面的代碼片段。它被幾個CPU并行的執行。第 1行設置共享變量的值為當前CPU的ID,第2行調用gettb()函數對幾個值進行初始化,該函數讀取硬件時間計數,這個計數值由SOC硬件給出,并且在所有CPU之間共享。當然,這個硬件計數值主要是在power架構上有效,筆者在powerpce500架構上經常使用它。第3-8行的循環,記錄變量在當前CPU上保持的時間長度。

1 state.variable = mycpu;

2 lasttb = oldtb = firsttb = gettb();

3 while (state.variable == mycpu) {

4 lasttb = oldtb;

5 oldtb = gettb();

6 if (lasttb - firsttb >1000)

7 break;

8 }

在退出循環前,firsttb 將保存一個時間戳,這是賦值的時間。lasttb 也保存一個時間戳,它是對共享變量保持最后賦予的值時刻的采樣值,如果在進入循環前,共享變量已經變化,那么就等于firsttb。

這個數據是在一個1.5GHz POWER5 8核系統上采集的。每一個核包含一對硬件線程。CPU 1、2、3和4記錄值,而CPU 0 控制測試。時間戳計數器周期是5.32ns,這對于我們觀察緩存狀態來說是足夠了。

pYYBAGQcFzCAIQELAABVyV8NpOE647.jpg

上圖的結果,展示出每個CPU識別到變量保持的時間。每一個水平條表示該CPU觀察到變量的時間,左邊的黑色區域表示相應的CPU第一次計數的時間。在最初5ns期間, 僅僅CPU 3擁有變量的值。在接下來的10ns,CPU 2和3看到不一致的變量值,但是隨后都一致的認為其值是“2”。 但是,CPU 1在整個300ns內認為其值是“1”,并且 CPU 4 在整個500ns內認為其值是“4”。

這真是一個匪夷所思的測試結果。同一個變量,竟然在不同的CPU上面被看到不同的值!!!!

如果不理解硬件,就不會接受這個匪夷所思的測試結果。當然了,此時如果有一位大師站在你的面前,你也不能夠跟隨大師的節奏起舞。

四、為什么需要MESI

請不要說:我還不知道MESI是什么?

簡單的說,MESI是一種內存緩存一致性協議。

現代CPU的速度比現代內存系統的速度快得多。2006 年的CPU可以在每納秒內執行十條指令。但是需要很多個十納秒才能從物理內存中取出一個數據。它們的速度差異(超過2個數量級)導致在現代CPU中出現了數兆級別的緩存。這些緩存與CPU是相關聯的,如下圖。典型的,緩存可以在幾個時鐘周期內被訪問。借助于CPU流水線的幫助,我們暫且可以認為,緩存能夠抵消內存對CPU性能的影響。

pYYBAGQcF0iAZE0TAABGTvNLlF8824.jpg

CPU緩存和內存之間的數據流是固定長度的塊,稱為“緩存行”,其大小通常是2的N次方。范圍從16到256字節不等。當一個特定的數據第一次被CPU訪問時,它在緩存中還不存在,這稱為“cache miss”(或者可被更準確的稱為“startup cache miss”或者“warmupcache miss”)。“cache miss”意味著:CPU在從物理內存中讀取數據時,它必須等待(或處于“stalled”狀態) 數百個CPU周期。但是,數據將被裝載入CPU緩存以后,后續的訪問將在緩存中找到,因此可以全速運行。

經過一段時間后,CPU的緩存將會被填滿,后續的緩存缺失需要換出緩存中現有的數據,以便為最近的訪問項騰出空間。這種“cache miss”被稱為“capacitymiss”,因為它是由于緩存容量限制而造成的。但是,即使此時緩存還沒有被填滿,大量緩存也可能由于一個新數據而被換出。這是由于大量的緩存是通過硬件哈希表來實現的,這些哈希表有固定長度的哈希桶(或者叫“sets”,CPU設計者是這樣稱呼的),如下圖。

pYYBAGQcF2GAAgiWAADzwSvfq7Q112.jpg

這個緩存有16個“sets”和2“路”,共32個“緩存行”,每個節點包含一個256字節的“緩存行”,它是一個256字節對齊的內存塊。這個緩存行稍微顯得大了一點,但是這使得十六進制的運行更簡單。從硬件的角度來說,這是一個兩路組相聯緩存,類似于帶16個桶的軟件哈希表,每個桶的哈希鏈最多有兩個元素。大小 (本例中是32個緩存行) 和相連性 (本例中是2) 都被稱為緩存的“geometry”。由于緩存是硬件實現的,哈希函數非常簡單:從內存地址中取出4位(哈希桶數量)作為哈希鍵值。

程序代碼位于地址0x43210E00- 0x43210EFF,并且程序依次訪問地址0x12345000-0x12345EFF時,圖中的情況就可能發生。假設程序正準備訪問地址0x12345F00,這個地址會哈希到 0xF行,該行的兩路都是空的,因此可以提供對應的256字節緩存行。如果程序訪問地址0x1233000,將會哈希到第0行,相應的256字節緩存行可以放到第1路。但是,如果程序訪問地址0x1233E00,將會哈希到第0xE行,必須有一個緩存行被替換出去,以騰出空間給新的行。如果隨后訪問被替換的行,會產生一次“cache miss”,這樣的緩存缺失被稱為“associativitymiss”。

更進一步說,我們僅僅考慮了讀數據的情況。當寫的時候會發生什么呢?由于在一個特定的CPU寫數據前,讓所有CPU都意識到數據被修改這一點是非常重要的。因此,它必須首先從其他CPU緩存中移除,或者叫“invalidated”(使無效)。一旦“使無效”操作完成,CPU可以安全的修改數據項。如果數據存在于該CPU緩存中,但是是只讀的,這個過程稱為“write miss”。一旦某個特定的CPU使其他CPU完成了“使無效”操作,該CPU可以反復的重新寫(或者讀)數據。

最后,如果另外某個CPU試圖訪問數據項,將會引起一次緩存缺失,此時,由于第一個CPU為了寫而使得緩存項無效,這被稱為“communication miss”。因為這通常是由于幾個CPU使用緩存通信造成的(例如,一個用于互斥算法的鎖使用這個數據項在CPU之間進行通信)。

很明顯,所有CPU必須小心的維護數據的一致性視圖。這些問題由“緩存一致性協議”來防止,常用的緩存一致性是MESI。

五、MESI的四種狀態

MESI 存在“modified”,“exclusive”,“shared”和“invalid”四種狀態,協議可以在一個指定的緩存行中應用這四種狀態。因此,協議在每一個緩存行中維護一個兩位的狀態標記,這個標記附著在緩存行的物理地址和數據后面。

處于“modified”狀態的緩存行是由于相應的CPU最近進行了內存存儲。并且相應的內存確保沒有在其他CPU的緩存中出現。因此,“modified”狀態的緩存行可以被認為被CPU所“擁有”。由于該緩存保存了“最新”的數據,因此緩存最終有責任將數據寫回到內存,也應當為其他緩存提供數據,并且必須在緩存其他數據之前完成這些事情。

“exclusive”狀態非常類似于“modified”狀態,唯一的差別是該緩存行還沒有被相應的CPU修改,這也表示緩存行中的數據及內存中的數據都是最新的。但是,由于CPU能夠在任何時刻將數據存儲到該行,而不考慮其他CPU,因此,處于“exclusive”狀態也可以認為被相應的CPU所“擁有”。也就是說,由于物理內存中的值是最新的,該行可以直接丟棄而不用回寫到內存,也不用通知其他CPU。

處于“shared”狀態的緩存行可能已經被復制到至少一個其他CPU的緩存中,這樣在沒有得到其他CPU的許可時,不能向緩存行存儲數據。與“exclusive”狀態相同,此時內存中的值是最新的,因此可以不用向內存回寫值而直接丟棄緩存中的值,也不用通知其他CPU。

處于“invalid”狀態的行是空的,換句話說,它沒有保存任何有效數據。當新數據進入緩存時,它被放置到一個處于“invalid”狀態的緩存行。這個方法是比較好的,因為替換其他狀態的緩存行將引起大量的緩存缺失。

由于所有CPU必須維護緩存行中的數據一致性視圖,因此緩存一致性協議提供消息以標識系統中緩存行的動作。

六、MESI消息

MESI協議需要在CPU之間通信。如果CPU在單一共享總線上,只需要如下消息就足夠了:

讀消息:“讀”消息包含要讀取的緩存行的物理地址。

讀響應消息:“讀響應”消息包含較早前的“讀”消息的數據。這個“讀響應”消息可能由物理內存或者其他CPU的緩存提供。例如,如果一個緩存處于“modified”狀態,那么,它的緩存必須提供“讀響應”消息。

使無效消息:“使無效”消息包含要使無效的緩存行的物理地址。其他的緩存必須從它們的緩存中移除相應的數據并且響應此消息。

使無效應答:一個接收到“使無效”消息的CPU必須在移除指定數據后響應一個“使無效應答”消息。

讀使無效:“讀使無效”消息包含緩存行要讀取的物理地址。同時指示其他緩存移除數據。因此,它同時包含一個“讀”消息和一個“使無效”消息。“讀使無效”消息同時需要“讀響應”消息以及“使無效應答”消息進行答應。

寫回:“寫回”消息包含要回寫到物理內存的地址和數據。(并且也許會“探測”其他CPU的緩存)。這個消息允許緩存在必要時換出處于“modified”狀態的數據以騰出空間。

再次重申,所有這些消息均需要在CPU之間傳播電信號,都面臨霍金提出的那兩個IT難題。

七、MESI狀態轉換

pYYBAGQcF3WABnE7AABsngR-l3Y325.jpg

Transition (a):緩存行被寫回到物理內存,但是CPU仍然將它保留在緩存中,并在以后修改它。這個轉換需要一個“寫回”消息。

Transition (b):CPU將數據寫到緩存行,該緩存行目前處于排它訪問。不需要發送或者接收任何消息。

Transition (c):CPU收到一個“讀使無效”消息,相應的緩存行已經被修改。CPU必須使無效本地副本,然后響應“讀響應”和 “使無效應答”消息,同時發送數據給請求的CPU,標示它的本地副本不再有效。

Transition (d):CPU進行一個原子讀—修改—寫操作,相應的數據沒有在它的緩存中。它發送一個“讀使無效”消息,通過“讀響應”消息接收數據。一旦它接收到一個完整的“使無效應答”響應集合,CPU就完成此轉換。

Transition (e):CPU進行一個原子讀—修改—寫操作,相應的數據在緩存中是只讀的。它必須發送一個“使無效”消息,并等待“使無效應答”響應集合以完成此轉換。

Transition (f):其他某些CPU讀取緩存行,其數據由本CPU提供,本CPU包含一個只讀副本。數據只讀的原因,可能是由于數據已經回寫到內存中。這個轉換開始于接收到一個“讀”消息,最終本CPU響應了一個“讀響應” 消息。

Transition (g):其他CPU讀取數據,并且數據是從本CPU的緩存或者物理內存中提供的。無論哪種情況,本CPU都會保留一個只讀副本。這個事務開始于接收到一個“讀”消息,最終本CPU響應一個“讀響應”消息。

Transition (h):當前CPU很快將要寫入一些數據到緩存行,于是發送一個“使無效”消息。直到它接收到所有“使無效應答”消息后,CPU才完成轉換。可選的,所有其他CPU通過“寫回”消息將緩存行的數據換出(可能是為其他緩存行騰出空間)。這樣,當前CPU就是最后一個緩存該數據的CPU。

Transition (i):其他某些CPU進行了一個原子讀—修改—寫操作,相應的緩存行僅僅被本CPU持有。本CPU將緩存行變成無效狀態。這個轉換開始于接收到“讀使無效”消息,最終本CPU響應一個“讀響應”消息以及一個“使無效應答”消息。

Transition (j):本CPU保存一個數據到緩存行,但是數據還沒有在它的緩存行中。因此發送一個“讀使無效”消息。直到它接收到“讀響應”消息以及所有“使無效應答”消息后,才完成事務。緩存行可能會很快轉換到“修改”狀態,這是在存儲完成后由Transition (b)完成的。

Transition (k):本CPU裝載一個數據,但是數據還沒有在緩存行中。CPU發送一個“讀”消息,當它接收到相應的“讀響應”消息后完成轉換。

Transition (l):其他CPU存儲一個數據到緩存行,但是該緩存行處于只讀狀態(因為其他CPU也持有該緩存行)。這個轉換開始于接收到一個“使無效”消息,當前CPU最終響應一個“使無效應答”消息。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10873

    瀏覽量

    212056
  • 電信號
    +關注

    關注

    1

    文章

    820

    瀏覽量

    20606
  • LINUX內核
    +關注

    關注

    1

    文章

    316

    瀏覽量

    21664
  • rcu
    rcu
    +關注

    關注

    0

    文章

    21

    瀏覽量

    5455

原文標題:謝寶友: 深入理解Linux RCU之一——從硬件說起

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Linux kernel同步機制及原子操作,自旋鎖,信號量和互斥鎖

    原子操作的概念來源于物理概念中的原子定義,指執行結束前不可分割(即不可打斷)的操作,是最小的執行單位。
    的頭像 發表于 08-18 15:05 ?5794次閱讀
    Linux kernel同步機制及<b class='flag-5'>原子</b><b class='flag-5'>操作</b>,自旋鎖,信號量和互斥鎖

    一文詳解RTOS開發中的原子操作

    裸機開發與RTOS開發一個非常重要的區別在于多線程之間的消息傳遞和數據共享問題,然而在這中間變量的原子操作是一個非常重要的話題,不同的處理器架構和編譯選項都可能生成不同的指令,從而影響到變量的原子
    發表于 11-17 09:43 ?1746次閱讀

    詳解Linux內核鎖的原子操作

    原子操作(atomic operation),不可分割的操作。其通過原子變量來實現,以保證單個CPU周期內,讀寫該變量,不能被打斷,進而判斷該變量的值,來解決并發引起的互斥。
    發表于 07-04 11:16 ?522次閱讀

    原子操作指令的作用

    本帖最后由 ycd37850105 于 2016-9-18 21:41 編輯 我們把單指令的操作稱為原子操作(Atomic),因為無論如何,單條指令的執行是不會被打斷的。很多體系結構都提供了
    發表于 09-18 21:39

    MCU上的無鎖原子操作

    來源網絡原子操作是在MCU并發編程中常用的操作,簡單舉個例子來闡述問題:我們使用RTOS或裸機狀態編程時,必然需要一個全局時鐘基準,通常是在一個定時器中斷中累加實現,簡化代碼如下:s
    發表于 03-06 09:39

    UCOS怎么實現原子操作

    目前有個全局變量和數字,需要在中斷函數中和任務中都要訪問,請問各位大神UCOS怎么實現原子操作?網上搜索一圈沒發現實例呢,是大家都不用原子操作
    發表于 05-20 09:57

    讓CPU告訴你硬盤和網絡到底多慢

    硬盤和網絡到底多慢看了就知道
    發表于 02-22 06:30

    小編科普CPU緩存一致性協議MESI

    什么是緩存一致性協議MESIMESI協議中的狀態哪幾種?MESI協議中的狀態是如何相互轉換的?
    發表于 06-17 10:00

    基于多線程環境下值的遞增操作--原子操作

    因此在多線程環境中對一個變量進行讀寫時,我們需要有一種方法能夠保證對一個值的遞增操作原子操作——即不可打斷性,一個線程在執行原子
    的頭像 發表于 01-10 11:16 ?6185次閱讀
    基于多線程環境下值的遞增<b class='flag-5'>操作</b>--<b class='flag-5'>原子</b><b class='flag-5'>操作</b>

    站在CPU 的角度看這個世界,說說到底它們多慢

    最為我們熟知的關于計算機不同組件速度差異的圖表,是下面這種金字塔形式:越往上速度越快,容量越小,而價格越高。這張圖只是給了我們一個直觀地感覺,并沒有對各個速度和性能做出量化的說明和解釋。而實際上,不同層級之間的差異要比這張圖大的多。這篇文章就讓你站在 CPU 的角度看這個世界,說說到底它們
    的頭像 發表于 02-03 16:16 ?4652次閱讀
    站在CPU 的角度看這個世界,說說到底它們<b class='flag-5'>有</b><b class='flag-5'>多慢</b>

    淺談鴻蒙內核源碼的原子操作

    ARMv6架構引入了LDREX和STREX指令,以支持對共享存儲器更縝密的非阻塞同步。由此實現的原子操作能確保對同一數據的“讀取-修改-寫入”操作在它的執行期間不會被打斷,即操作
    的頭像 發表于 04-25 16:05 ?1279次閱讀
    淺談鴻蒙內核源碼的<b class='flag-5'>原子</b><b class='flag-5'>操作</b>

    關于CAS等原子操作介紹 無鎖隊列的鏈表實現方法

    在開始說無鎖隊列之前,我們需要知道一個很重要的技術就是CAS操作——Compare & Set,或是 Compare & Swap,現在幾乎所有的CPU指令都支持CAS的原子操作
    的頭像 發表于 05-18 09:12 ?3441次閱讀
    關于CAS等<b class='flag-5'>原子</b><b class='flag-5'>操作</b>介紹 無鎖隊列的鏈表實現方法

    使用Linux原子操作實現互斥點燈

    Linux原子操作是指不能再進一步分割的操作,一般原子操作用于變量或者位操作。Linux內核定義
    的頭像 發表于 04-13 15:07 ?903次閱讀
    使用Linux<b class='flag-5'>原子</b><b class='flag-5'>操作</b>實現互斥點燈

    添加原子操作到4.0.2版本

    原子操作很好用,在兩三個小線程要同步變量時,非常方便不占用中斷,也不用資源。但是原子操作只有5.0.0版本上面才有,基于現有工程使用升級內核不太現實,所以要添加一下。
    的頭像 發表于 09-06 15:03 ?903次閱讀

    如何使用原子類型

    一、何為原子操作 原子操作:顧名思義就是不可分割的操作,該操作只存在未開始和已完成兩種狀態,不存
    的頭像 發表于 11-10 16:21 ?845次閱讀
    如何使用<b class='flag-5'>原子</b>類型
    主站蜘蛛池模板: 久久国产精品免费网站| 无码人妻精品一区二区蜜桃色欲| 亚洲国产欧美在线人成aaaa20| 国产色无码精品视频国产| 亚洲欧美日本中文子不卡| 久久久久久久伊人电影| hd性欧美俱乐部中文| 天天澡夜夜澡人人澡| 久久精品视频3| 成年美女黄网站色app| 亚洲福利视频导航| 美女扒开尿口让男生添动态图| 成年妇女免费播放| 亚洲人成人77777在线播放| 天天爽夜夜爽夜夜爽| 国产午夜一级淫片| 在线亚洲精品国产一区麻豆| 97蜜桃网123| 日韩精品卡1卡2三卡四卡乱码 | 秋霞网在线伦理免费| 国产一区日韩二区欧美三区| 最近中文字幕高清中文字幕MV| 日本人六九视频| 久久精品热播在线看| 超碰 无码 中文字幕| 伊人久久大香网| 肉动漫3D卡通无修在线播放| 久草在线草a免费线看| 动漫美女3d被爆漫画| 中文字幕爆乳JULIA女教师| 色欲AV久久综合人妻蜜桃| 久久天天婷婷五月俺也去| 国产高清视频在线观看不卡v| 中文字幕人成人乱码亚洲AV| 乌克兰肛交影视| 欧美最猛黑人XXXXWWW| 精品国产乱码久久久久久上海公司| rio 快播| 18禁止观看免费私人影院| 亚洲国产精品无码AV久久久| 青草久久久|