為解決高速以太網鏈路接口中軟件方式實現的MAC層地址表機制在處理效率上受到制約的問題,提出了一種基于FPGA (現場可編程門陣列)硬件電路方式實現以太網交換機中MAC地址表的查找,學習和老化。該方法采用hashing算法建立地址表項索引值與MAC地址之間的對應關系,完成滿足平均時間復雜度為O (1)的地址查找。由于實際交換機中地址表容量有限,地址學習只能是MAC地址的子集,通過優化hashing函數降低地址沖突發生的概率以及設計一種地址老化機制提高地址表查找能力。仿真結果表明,地址表機制采用硬件電路方式實現比軟件方式處理效率更高。
引 言
在計算機網絡中,數據鏈路層完成節點到節點的通信,二層以太網交換機屬于數據鏈路層設備[1]。MAC (介質訪問控制)地址是在網絡通信用來識別主機的標識。交換機的緩存中有一個MAC地址表,需要轉發數據時,交換機會在地址表查詢是否有與目的MAC地址對應的表項,如果有,交換機立即將數據報文往該表項中的轉發端口發送;如果沒有,交換機則會將數據報文以廣播的形式發送到除了接收端口外的所有端口,盡最大能力保證目的主機接收到數據報文。因此,交換機地址表的構建和維護決定了數據轉發的方向和效率。
MAC層地址表存儲查找多基于hash表。Hashing是一種用于以常熟平均時間插入、刪除和查找的技術,hash表通過把關鍵碼值映射到表中一個位置來訪問記錄。這個映射函數叫做hashing函數,存放記錄的數組叫做hash表。交換機地址表存儲的是全部MAC地址的一個子集因此必然會發生地址沖突,文獻[2-3]對比了幾種解決沖突的方法。
MAC地址表的容量是有限的,因此交換機采用老化機制來維護MAC地址表,以保證最大限度地利用地址表項資源。交換機在構建某條表項時,會相應地開啟該表項的老化定時器[4],如果在老化時間內,交換機始終沒有收到該表項中的MAC地址的報文,交換機就會將該表項刪除,失效的表項不會繼續占用MAC地址表資源。這樣,即使網絡中的設備更換或者移除,交換機的MAC地址表始終能保持網絡中最新的拓撲結構記錄。合適的老化時間可以提高MAC地址表項資源的利用率,但過長或過短的老化時間,反而影響交換機的性能。如果老化時間過長,交換機中保存的MAC地址表項的數量過多會將地址表資源消耗完,網絡中的拓撲變化就無法及時更新;如果老化時間過短,則有效的MAC地址表項會被交換機過早刪除,從而降低交換機的轉發效率。
傳統的MAC地址表處理機制主要采用軟件的方式實現[5]。隨著以太網鏈路接口的速率從1Gb/s發展到10Gb/s,基于軟件的算法在速度上受到串行計算機系統的制約。新一代現場可編程門陣列(FPGA)的出現以后,算法通過硬電路描述,所有的延遲只來源于門電路,而一般門電路的延遲都在ns級別。減少了系統運行所需的時鐘周期數,實現了真正的高速率。
1 地址表處理機制
本數字電路設計中,采用單一時鐘域的同步時序設計,所有的觸發器都是在同一個時鐘節拍下進行翻轉。這樣就簡化了整個設計,后端綜合、布局布線的時序約束容易實現。
地址表占用的空間由片內存儲器RAM 提供,片內存儲器是基于FPGA的系統可使用的最簡單的存儲器,存儲、讀取是在FPGA內部完成,電路板上無需外部連線,具有最高吞吐量和最低反應延時的,適用于緩存和查找表。地址表表項中至少記錄mac物理地址,端口號。每個mac地址表項的數據結構見表1。
?
定義如下:
Valid:表項有效指示,1代表有效表項,0代表空閑表項。
Age:老化比特,地址表更新時查詢的位段,1代表年輕,0代表老化。
Mac address:48bit物理地址。
Port_id:物理地址對應的端口號。
地址表項寫入表中的位置即地址學習由源地址(MAC地址)經過hashing算法求得的索引值決定。地址表項的讀取即地址表查詢由目的地址(物理地址)經過hashing算法求得的索引值決定。Hashing算法本身消耗一部分時序,物理地址的學習和查詢就需要等待這部分時序,為了使得地址表處理起來更加清晰、明確,整個設計分為3個模塊(如圖1所示):地址表的輸入調整、地址表處理機制、地址表的輸出調整。
?
模塊劃分后,本級模塊向下一級模塊一次性交付需要處理的所有并行數據。
1.1 地址表輸入調整(fifo_in)
Fifo_in模塊完成兩種操作,對輸入的MAC地址求解hashing索引值(xx_mac_index);間隔4s產生地址表更新信號(upd_en),更新信號為高電平有效,持續時間由地址表的深度決定,遍歷地址表,一個時鐘周期處理一個表項。
Hashing算法:為了快速的存取地址表項,采用hashing算法[6]建立地址表項索引值與實際MAC地址之間的對應關系(每個MAC地址只能對應一個索引值,但是每個索引值有可能對應多個MAC地址,即發生了地址沖突)。
使用復雜的hashing算法,會延長計算索引的時間,降低地址表的查找速度,增加交換機的包轉發時延。
在交換控制芯片設計中本項目算法使用CRC-CCITTD多項式 為hashing函數,48位MAC地址由CRC[7-8]校驗方法后的結果通過hashing函數求得16位余數,取結果16位余數中11個比特用于2KB地址表項索引值。Hashing函數計算的狀態機如圖2所示。
?
交換機MAC層容納的地址表大小是有限的,理論上實際的物理地址有2的48次方個,地址表只能記錄其中一個很小的子集,因此hashing函數不可避免地將不同的MAC地址映射到相同的地址表項索引值。如果以太網中地址表項索引值與MAC地址存在多對一的情況,就是發生了“地址沖突”。地址沖突的存在也說明總有部分MAC地址丟失,不能被交換機學習到。地址沖突的解決方法在1.2中予以實現。
?
地址表組織結構如圖3。圖3左邊列出的是地址表RAM 中每個hashing桶內表項0在RAM 中的地址。在開始地址存儲和查找時,通過CRC校驗得到的索引值指向的hashing桶內表項0與表項1被讀出,通過對MAC地址域進行比較確定匹配的表項,得到轉發端口的信息。
1.2 地址表處理機制的實現方法(AddrList_Proc)
1.2.1 地址學習和查找的實現
以太網幀結構中的源地址(sa_mac)用于地址學習。目的地址(da_mac)用于地址查找。
對于較大吞吐量的交換芯片,能做到平均時間復雜度滿足線性的學習和查找。學習和查找采用hashing算法,發生碰撞采用hashing算法,碰撞后采用相鄰空間開放定址法(open addressing hashing)[9-10]。
學習的過程如下:
(1)根據hashing索引值sa_index,檢索MAC 地址表。
(2)表項中Valid字段若為1代表該表項已占用,轉(3),否則表項空閑,轉(7)。
(3)表項內容中的MAC地址與sa_mac進行比較,若相同I_Find置1,轉(7),否則轉(4),此時發生地址沖突。
(4)sa_index+1表項中Valid字段若為1代表此處表項已占用,轉(5),否則表項空閑轉(7)。
(5)表項內容中的MAC地址與sa_mac進行比較,若相同I_Find置1,轉(7),否則轉(6),此時發生地址沖突。
(6)此時有超過兩個不同的MAC地址映射同一索引值,并且先到的寫入sa_index和sa_index+1處。后面到達的MAC地址覆蓋掉sa_index處表項,完成一次學習。
(7)寫入該位置,Valid置1,Age置1,完成一次學習。
查找的過程如下:
(1)判斷是不是廣播包,若是轉(10),否則轉(2)。
(2)根據hashing索引值da_index,檢索MAC 地址表。
(3)da_index和da_index+1的Valid字段組成二元組<valid0,valid1>,<0,0>轉(4)、<0,1>轉(5)、<1,0>轉(6)、<1,1>轉(7)。
(4)da_mac不在地址表中,轉(9)。
(5)da_index+1表項內容中MAC地址與da_mac比較,若兩者相同,轉(8),否則轉(9)。
(6)da_index表項內容中MAC地址與da_mac比較,若兩者相同,轉(8),否則轉(9)。
(7)da_mac在地址表中轉(8),否則轉(9)。
(8)讀取表項內容中的端口號,與da_mac組成一組數據發給到fifo_out,完成一次查找。
(9)廣播該MAC地址,發送da_mac和需要廣播標志位給fifo_out,完成一次查找。
(10)I_Find標志位為1代表地址表中有廣播請求的MAC地址,不需要繼續廣播下去。I_Find標志位為0代表需要繼續廣播下去,轉(11)。
(11)發送sa_mac和需要廣播標志位給fifo_out,完成一次查找。
1.2.2 地址老化的實現
交換機通過端口發送和接收幀的源地址(源MAC地址、端口號)將存儲到地址表中。老化時間是一個影響交換機學習進程的參數。為地址表中每條地址項添加一個計數器用于表示該地址項的更新時間,通過查詢計數器位是否為零判斷一個地址是否已經老化。在更新過程中,所有的輸出引腳處于“懸掛”。
老化過程如下:
(1)檢測到更新信號upd_en為高電平時,開始遍歷整個地址表。
(2)表項中Age字段為1,代表上一次遍歷周期到此遍歷周期內該表項對應的MAC 地址被重新寫入過,轉(3),否則(4)。
(3)表項中的Valid字段保持1,Age字段置0。
(4)表項中的Valid字段置0 (刪除已老化的)。
(5)等待upd_en為低電平時停止遍歷,完成一次地址老化。
3 地址表的輸出調整(fifo_out)
Fifo_out模塊根據前一級提供的各種標志信號,實現對輸出的控制。輸入的數據信號有源地址,目的地址,查找到的表項,輸入的標志信號有nd_br_packet (需要廣播標志),Is_br_packet(是廣播包標志)。
Is_br_packet=1,nd_br_packet=0代表“是廣播包,不需要廣播”,對應地址表處理機制中的事件—接收到廣播包中的MAC地址存在地址表中。沒有輸出。
Is_br_packet=1,nd_br_packet=1代表“是廣播包,需要廣播”,對應地址表處理機制中的事件—繼續廣播下去。sa_mac經過封裝由dout0~dout3輸出。
Is_br_packet=0,nd_br_packet=0代表“不是廣播包,不需要廣播”,對應地址表處理機制中的事件—單播包中目的地址存在地址表中。表項經過封裝,對應端口輸出。
Is_br_packet=0,nd_br_packet=1代表“不是廣播包,需要廣播”,對應地址表處理機制中的事件—目的地址不存在地址表中。da_mac經過封裝由dout0~dout3輸出。
2 不同hashing函數的沖突率
Hashing算法的主要原理就是把大范圍映射到小范圍,沖突率和hashing函數的選取有密切的關系,圖4中選取了4種不hashing函數下發生地址沖突的概率。情況一采用的Hashing函數為MAC地址和自身倒序做異或運算所得的結果經過CRC計算后取最后11位索引值;情況二采用的Hashing函數為MAC地址和自身倒序做異或運算所得的結果經過CRC計算后取前11位索引值;情況三采用的Hashing函數為MAC地址平方后取中間11位為索引值,情況四采用的Hashing函數為將MAC地址分割成位數相同的3部分,疊加這三部分的和取后11位為索引值。
仿真過程描述如下:
48位二進制數表示的范圍劃分為三子段,每個子段隨機生成3000個數。一共有9000個隨機MAC地址,依次按照4種情況提供的hashing函數計算結果,索引值一樣沖突加一,分別在不同的地址表容量下求沖突率。
不同hashing函數沖突率如圖4所示。
?
仿真結果表明地址表項容量和MAC地址數量接近時基本不發生沖突,在地址表較小情況下對于本次實驗給出的信源情況三的hashing函數有較小的沖突率。所以在選取hashing函數時要結合該節點實際收發MAC地址的概率模型,這樣才能有效的降低地址沖突發生。
3 設計與驗證
仿真過程中,時鐘周期100ns,MAC地址取48bit中的后16bit,地址表深度為64,hashing算法采用CRC8取結果的后6bit。這樣處理的理由有兩點:第一48bit與16bit原理相同,16bit占用的資源少;第二MAC地址前24bit是由設備廠商分配的序列號,對于一部分MAC地址只有后16bit不同。
sa_mac既是輸入也是輸出,fifo_in內的寄存器保存一次輸入信號,待hashing算法后和索引值同步輸出,如圖5所示。
?
圖6的仿真結果中可以看到,1200ns學習到MAC地址(16′h7A0C),1500ns接收到對該MAC地址的廣播包,停止繼續廣播下去。
?
圖7的仿真結果中可以看到2100ns查詢的目的地址(16’hC0A7)存在于地址表中,它是2000ns寫入地址表中的。
?
圖8中所示2600ns開始地址更新,消耗64個時鐘周期,遍歷所有的表項。9000ns后的輸入和地址表更新前得輸入相同,可以看出有相同的輸出。
?
圖9所示不同的標志信號控制不同的輸出,可以看到1700ns和1800ns都是向端口2轉發數據。1400ns向4個端口廣播。
?
4 結束語
對于以太網交換機來說,主要工作是根據收到數據幀中的目的MAC地址,對MAC地址表進行查找,把數據幀轉發到相應的端口。MAC地址表的查表效率直接影響交換機的性能。Hashing算法可以實現高效率的存儲和查找,但存在地址沖突,選擇合適的hashing函數是解決問題的有效途徑之一。比如可以統計交換機各端口hashing索引值的概率分布,找出發生沖突較高的區域,對這些區域按照概率進行排序,hashing函數針對沖突域中概率大的幾個MAC地址來構造。
評論
查看更多