大數據時代對存儲和處理的要求越來越高。相應地,需要更快的數據傳輸速度。
根據數據表的聲明選擇系統時,陷阱在等著你
大數據時代對存儲和處理的要求越來越高。相應地,需要更快的數據傳輸速度。
當客戶選擇固態硬盤 (SSD) 時,他們通常會參考數據表的性能數據。但是,數據表中的數字并不能準確表示典型的 SSD 性能。通常可以理解的是,從處理器和存儲設備獲得的實際性能與數據表和基準測試中聲稱的性能有很大不同。因此,根據夸大的數字選擇設備可能會導致系統不符合其要求。
使用水晶磁盤測試測量實際性能
數據表中的開箱即用聲明與實際穩態基準之間的差異有多大?
為了測量開箱即用和穩態性能之間的差異,我們使用水晶磁盤基準測試工具,然后運行一系列隨機寫入72小時,然后再次測量水晶磁盤的性能。
我們仔細測量了閃存控制器的實際性能,并與競爭對手的性能進行了比較。
實際性能與數據表聲明
實際性能和數據表性能之間的差異令人震驚。
在我們基準測試的某些設備中,穩態速度可能低至開箱即用性能的1%。更令人驚訝的是性能下降的速度有多快。在幾乎所有測試的驅動器中,使用約1.5分鐘后,性能急劇下降。
我們的研究結果表明,在閃存的情況下,除了不切實際的峰值數字和應用程序性能之間的通常差異之外,即使是原始性能數字也可能經不起實踐的審查。
數據表聲明和實際基準測試之間有什么區別?
為了增加閃存的存儲密度,制造商現在為每個存儲單元存儲多個位。三級單元 (TLC) 內存存儲三位,較新的四級單元 (QLC) 內存每個單元存儲四位。
但是,高密度存儲是有代價的。
當閃存充滿數據時,閃存控制器必須執行各種后臺任務。例如,垃圾回收、磨損均衡、動態數據刷新和校準在后臺進行。控制器可以通過確定 I/O 操作的優先級和調度,在短時間內“隱藏”這些影響。但是,對于較長的傳輸時間,這些任務不可避免地會對性能產生一些影響。從長遠來看,磨損均衡和垃圾回收等后臺任務變得更加耗時。
大量涌入閃存的數據也會對順序和隨機訪問造成影響。用于表征SSD的兩個主要測量方法是順序訪問,其中大塊連續數據傳輸到存儲設備或從存儲設備傳輸,以及隨機訪問,其中少量數據被讀取或寫入非連續地址。順序訪問通常以兆字節每秒 (MB/s) 為單位進行測量,而隨機訪問通常以每秒輸入/輸出操作數 (IOPS) 的形式給出。
當緩存中充滿數據時,閃存上的可用空間會減少。因此,緩存在長時間的順序或隨機訪問序列后開始失去其有效性。隨著時間的推移,緩存的效率可能會越來越低,因為某些區域可能由于不可恢復的錯誤而被標記為不可用。
因此,隨著閃存的老化,高密度閃存中的原始錯誤率會更高,內存壽命也會縮短。軟錯誤解碼技術用于最大限度地減少隨著內存老化而增加的錯誤率。它們多次讀取數據,并且需要復雜的處理來計算正確的數據,這兩者都降低了整體性能。
隨著時間的推移,設備對在與寫入數據時不同的溫度下讀取數據所引起的跨溫度效應也變得更加敏感。SSD在使用過程中會變熱,因此為了防止過熱,采用了“熱節流”。熱節流可降低功耗并降低器件的溫度。但是,熱節流也會限制器件性能。熱節流的影響取決于環境溫度、環境的熱設計和設備工作負載。影響熱節流的變量數量使得預測實際性能水平變得困難。
總之,由于許多因素,SSD的性能水平在其生命周期內會發生變化,將其初始的開箱即用級別降至穩態級別。
主要收獲
在評估性能將影響整體系統性能的設備時,使用真實世界數據至關重要。任何基于夸大數字的選擇都有可能導致系統無法按預期運行。
實際性能將取決于數據使用模式、環境和閃存控制器的有效性。了解可能影響性能的因素至關重要,但更重要的是使用真實世界的數據,而不是不切實際的性能聲明。
因此,在選擇數據存儲設備時,請記住,設備數據表通常會顯示只有新設備在特定條件下才能達到的峰值數字,并且只能在短時間內實現。
審核編輯:郭婷
-
大數據
+關注
關注
64文章
8902瀏覽量
137601
發布評論請先 登錄
相關推薦
評論