這一篇文章講一講,高級錯誤報告(Advanced Error Reporting,AER)關于可校正和不可校正錯誤的相關寄存器,以及Root如何處理來自其他PCIe設備的錯誤消息等內容。
? 高級可校正錯誤處理(Advanced Correctable Error Handling)
o 高級可校正錯誤狀態
高級可校正錯誤狀態寄存器如下圖所示,當相關錯誤發生后,硬件會自動地將對應bit置1。軟件可以通過向對應bit寫1,來清零。
o 高級可校正錯誤屏蔽
高級可校正錯誤屏蔽寄存器如下圖所示,默認情況下,這些bit的值都是0。也就是說,只要發生相關錯誤,且該錯誤報告功能被使能,則相關錯誤便會被報告(不被屏蔽)。當然,軟件可以通過將相關bit置1,來屏蔽相關的錯誤報告信息。
? 高級不可校正錯誤處理(Advanced Uncorrectable Error Handling)
o 高級不可校正錯誤狀態
高級不可校正錯誤狀態寄存器如下圖所示,當相關錯誤發生時,不管這些錯誤會不會被報告到Root,相關的bit都會被置1。
回顧一下,前一篇文章中的當前錯誤指針(First Error Pointer)。假設該指針的值為18d,則表明不可校正錯誤狀態寄存器中的第18位對應的錯誤——異常的TLP(Malformed TLP)將會被最先處理。一旦該錯誤被處理后,軟件將會向不可校正錯誤狀態寄存器的第18位寫1,來清除該bit。然后,當前錯誤指針將會被更新到下一個值。
軟件可以通過高級不可校正錯誤嚴重度寄存器(Advanced Uncorrectable Error Severity Register)來修改不可校正錯誤是否被作為致命的(Fatal)錯誤處理,進而使得這些錯誤得到區分處理。如下圖所示,其中,0表示非致命的(Non-Fatal),1表示致命的(Fatal)。
o 高級不可校正錯誤屏蔽
高級不可校正錯誤評級寄存器如下圖所示,當相關bit被置1時,對應的錯誤類型將不會被報告。
配置空間中的高級錯誤報告結構中包含有一個4DW的子空間,用于緩存接收到的,發生不可校正錯誤的(未被屏蔽的)的TLP的包頭。PCIe Spec規定,當設備支持AER功能時,必須有能力至少緩存一個TLP包頭(4DW)。當然,有些設備可能支持緩存更多的TLP包頭。該子空間被稱為包頭緩存寄存器(Header Log Register),其支持的錯誤類型如下圖所示。
在PCIe總線拓撲結構中,Root是所有其他PCIe設備錯誤報告的目標(Target)。當Root接收到來自其他PCIe設備的錯誤消息(Error Message)后,Root會根據系統的參數設置選擇是否向系統報告錯誤,并以何種方式(中斷等)報告。
注:關于PCIe的中斷機制會在后續的文章中詳細介紹。
當Root接收到錯誤消息后,便會將Root錯誤狀態寄存器中的對應位置位。需要注意的時,由于Root自身也是PCIe設備,當其自身發生錯誤時,也會導致Root錯誤狀態寄存器中的對應位置位,就像是其收到了錯誤消息了一樣。該寄存器如下圖所示:
前面的文章介紹過,錯誤消息也是消息(Message)的一種。錯誤消息中包含了錯誤源設備的ID信息(BDF,Bus,Device and Function),根據ID信息,便可以確定錯誤源的位置等信息,同時將該信息緩存在高級源ID寄存器中,如下圖所示。
可以通過Root錯誤命令寄存器(Root Error Command Register)的相關bit來使能或者禁止相關類型的錯誤是否被報告至系統。如下圖所示:
-
寄存器
+關注
關注
31文章
5357瀏覽量
120632 -
PCIe
+關注
關注
15文章
1243瀏覽量
82766 -
root
+關注
關注
1文章
86瀏覽量
21401
原文標題:【博文連載】PCIe掃盲——高級錯誤報告AER(二)
文章出處:【微信號:ChinaAET,微信公眾號:電子技術應用ChinaAET】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論