LIFO或FIFO:測量數據中心以太網時延方法探討
?
時延是數據中心以太網的一個關鍵性能指標。這是因為在高頻率金融交易(HFT)、高性能計算(HPC)和類似的性能敏感型環境中,超低時延10GbE交換功能是處理巨大網絡流量的關鍵,這常常意味著每天上百萬次的交易。電子交易中價格和交易數據速率的不斷攀升以及保持競爭力的需求推動著金融市場股東們投資最新技術,以便支持螺旋式上升的帶寬要求,并降低數據流時延。
因此,現在時延測量已經成為數據中心以太網交換機供應商測試報告的一個重要部分。在評估這些系統所用的交換IC時,設計師需要明白時延測量方法有好多種,采用不正確的方法可能是一種錯誤,因為有些方法并不能測出真實性能。
近來在測試中使用的其中一些測量方法使得LAN交換芯片供應商聲稱具有超低時延。這是怎么做到的呢?使用末位進、首位出(LIFO)方法,存儲轉發交換機確實可以報告亞微秒的時延。然而,這不符合RFC1242,該文檔建議優先采用首位進到首位出(FIFO)方法:“理想情況下所有設備的測量都應從幀前導位之后的第一個實際位開始。”這種方法能夠更精確地測量數據包穿透交換機時遇到的任何存儲或處理時間。
交換機架構和時延
2006年推出的第一臺低時延10GbE交換機使用直通工作模式取得了十分優異的時延性能,這種模式下交換機可以在幀被完整接收之前就開始發送。而存儲轉發交換機不能取得低時延,這是因為數據包在從出口發送出去之前必須完全存儲在內存中。但并不是所有直通交換機都有相同的時延性能,因為它們采用的交換架構有很大的區別。
存儲器存取帶寬一直是交換芯片架構師心頭的痛。在使用傳統的交叉開關矩陣和內存設計時,將沒有足夠的片上帶寬允許每個輸入端口同時寫入相同的輸出隊列。為了解決這種阻塞問題,芯片架構可以在每個交換輸入端使用虛擬輸出隊列,即所謂的組合式輸入/輸出隊列(CIQQ)架構(圖1)。
?
圖1 組合式輸入/輸出隊列(CIQQ)架構
虛擬輸出隊列可以在每個輸入端口為每個交換輸出端口(出口)提供一個隊列。如果某個特定的出口隊列臨時受阻,那么與之對應的入口隊列將實行流控,而以其它出口為目的地的數據包可以避過這個受阻隊列,將數據發送給其它無阻塞的出口。然而,對于一個N端口交換機而言,這意味著N*N輸入隊列和關聯調度器,從而增加了很大的復雜性。同時還會增加數據包時延,因為每個數據包通過交換機時必須排隊兩次。鑒于VOQ和關聯調度器的復雜性,許多交換機設計通過一定程度的內部阻塞來降低復雜性,這將進一步增加時延。
新的共享式內存交換技術第一次通過SRAM IP實現性能提升,使交換機能夠支持具有特別低時延、完全無阻塞輸出排隊、共享的內存架構,見圖2。通過使用專有的高帶寬內存結構,交換架構可以做得更簡單,進而消除入口VoQ的復雜性和所需的額外內存。另外,組播數據包只需存儲一次,從而進一步降低了對片上內存的要求。由于只有一次內存入隊/出隊和非常低的內部阻塞,因此這種技術可以提供最低的時延。
?
圖2 具有特別低時延的輸出排隊、共享內存架構
- 第 1 頁:LIFO或FIFO:測量數據中心以太網時延方法探討
- 第 2 頁:時延測量方法
本文導航
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關閱讀:
- [電子說] IBM Security可落地經驗助企業構筑現代化安全屏障 2023-10-24
- [電子說] Andes旗下高性能多核矢量處理器IP的AX45MPV正式上市 2023-10-24
- [電子說] Marvell高速芯片互連采用臺積電最新3nm工藝,傳輸速率每秒240Tbps 2023-10-23
- [電子說] 用芯連接,渠道共創 | 2023英特爾中國區數據中心渠道客戶會高能集錦 2023-10-21
- [處理器/DSP] 深入探討Granite Rapids和Sierra Forest處理器架構技術 2023-10-20
- [通信網絡] 智算中心網絡架構設計及組網實踐案例 2023-10-20
- [電子說] 高帶寬低延時遠程flash訪問架構解析 2023-10-20
- [電子說] 數據中心短缺:人工智能未來的致命阻礙? 2023-10-20
( 發表人:葉子 )