衛(wèi)星中的高性能計(jì)算需要在以前是抗輻射鑄造廠生產(chǎn)的零件領(lǐng)域的環(huán)境中使用先進(jìn)的商用現(xiàn)貨 (COTS) 技術(shù)。這種環(huán)境的挑戰(zhàn)要求仔細(xì)實(shí)施硬件和軟件技術(shù),以生產(chǎn)具有作戰(zhàn)人員所需的先進(jìn)能力和操作可靠性的空間資產(chǎn)。
太空是一個(gè)很難做生意的地方。雖然被困在范艾倫帶中的帶電粒子可以為地球上的觀察者產(chǎn)生耀眼的極光效果,但由于自然輻射環(huán)境引起的退化可能是決定商業(yè)和軍事任務(wù)所用設(shè)備使用壽命的關(guān)鍵因素。不幸的是,在太空惡劣的輻射環(huán)境中,對(duì)穩(wěn)健技術(shù)的需求往往與對(duì)性能的需求相沖突。新技術(shù)可以為巨大的成功和巨大的失敗提供機(jī)會(huì)。如果設(shè)備中的新功能沒(méi)有得到很好的理解,或者設(shè)計(jì)工具的自動(dòng)功能使粗心的人陷入困境,那么最后一點(diǎn)尤其正確。
一般來(lái)說(shuō),輻射效應(yīng)可分為兩大類。由總電離劑量(TID)引起的磨損在任務(wù)過(guò)程中逐漸發(fā)生,因?yàn)榱慵磸?fù)遇到使半導(dǎo)體材料電離的粒子。在存儲(chǔ)器和微處理器等更復(fù)雜的集成電路中,當(dāng)傳播延遲增加、驅(qū)動(dòng)強(qiáng)度降低或數(shù)字設(shè)備無(wú)法切換狀態(tài)導(dǎo)致器件無(wú)法工作時(shí),晶體管級(jí)的變化會(huì)變成功能故障。當(dāng)單個(gè)高度電離的粒子與半導(dǎo)體相互作用時(shí),就會(huì)發(fā)生單事件效應(yīng)(SEE)。由此產(chǎn)生的電荷重組可以持續(xù)幾納秒到幾微秒,其影響從小的良性瞬變到設(shè)備的災(zāi)難性故障不等。
在地球同步軌道上,SEE通常由銀河宇宙射線引發(fā),這些宇宙射線已經(jīng)傳播了幾光年,導(dǎo)致您的零件出現(xiàn)問(wèn)題。在地球磁場(chǎng)內(nèi),SEE主要是由質(zhì)子引起的,質(zhì)子與構(gòu)成半導(dǎo)體的硅發(fā)生核反應(yīng),產(chǎn)生離開(kāi)破壞性電離軌道的子產(chǎn)物。
通常,通過(guò)使用抗輻射(RH)部件可以減輕輻射效應(yīng)問(wèn)題。然而,商用半導(dǎo)體行業(yè)的快速發(fā)展使得RH器件難以跟上商用現(xiàn)貨(COTS)部件中更高的存儲(chǔ)器密度和更高的加工性能。在許多情況下,沒(méi)有相對(duì)濕度等效物可用。對(duì)于要使用的這些COTS部件,必須考慮一定程度的輻射緩解,考慮到部件,環(huán)境和防護(hù)將如何相互作用。
高性能計(jì)算 = 高容量任務(wù)
各種技術(shù)以及 COTS 和 RH 器件的混合可以實(shí)現(xiàn)可靠的計(jì)算性能(圖 1)。單板計(jì)算機(jī) (SBC) 的核心是三個(gè)以三模式冗余架構(gòu) (TMR) 排列的 Power PC 處理器。檢測(cè)硬件在每個(gè)時(shí)鐘周期比較所有三個(gè)處理器的每個(gè)輸出。定期重新同步(清理)通過(guò)清除所有三個(gè)處理器的內(nèi)容來(lái)清除潛在錯(cuò)誤。如果發(fā)生錯(cuò)誤,將禁用令人不安的處理器,直到可以對(duì)其進(jìn)行清理。但是,系統(tǒng)繼續(xù)正常運(yùn)行,因?yàn)橥镀陛敵隼^續(xù)有效。通過(guò)改變洗滌速率,可以根據(jù)任務(wù)要求定制系統(tǒng)擾動(dòng)率。
圖1:SCS750 中使用的緩解技術(shù)摘要。
易失性和非易失性存儲(chǔ)器都是受糾錯(cuò)碼保護(hù)的商業(yè)設(shè)備。SDRAM使用配置為64個(gè)數(shù)據(jù)位和32個(gè)校驗(yàn)位的Reed-Solomon;此配置可檢測(cè)并更正任何雙設(shè)備故障。EEPROM歷來(lái)表現(xiàn)出對(duì)SEU的抗擾度,因此EEPROM可以在不太穩(wěn)健的ECC下運(yùn)行,并通過(guò)單位糾錯(cuò)來(lái)實(shí)現(xiàn)。另一方面,EEPROM具有較低的TID容差,并使用DDC的RadPak技術(shù)進(jìn)行封裝,以屏蔽芯片并減少封裝內(nèi)的劑量。
少數(shù)抗輻射部件用于選定的功能,其中從商業(yè)部件開(kāi)發(fā)解決方案的成本太困難或昂貴而不實(shí)用。這些功能包括 1553 接口和現(xiàn)場(chǎng)可編程門陣列 (FPGA)。由于其靈活性,F(xiàn)PGA為開(kāi)發(fā)抗輻射計(jì)算解決方案提供了一條快速途徑。在SCS750的情況下,F(xiàn)PGA中的觸發(fā)器受TMR保護(hù),用于支持處理器的投票電路和存儲(chǔ)器(SDRAM和閃存)的糾錯(cuò)。
閃存革命
閃存無(wú)處不在:手機(jī)、汽車、工業(yè)機(jī)器人等等。將閃存帶入太空任務(wù)的原因相當(dāng)明顯。隨著大批量生產(chǎn),生產(chǎn)高度可靠零件的龐大工業(yè)基地也隨之而來(lái)。閃存 NAND 具有極高的密度(高達(dá)數(shù)百 Gb),作為任務(wù)推動(dòng)者很有吸引力。
但是,附加功能并非沒(méi)有一些額外的怪癖。與SRAM等舊技術(shù)不同,NAND設(shè)備在正常工作條件下會(huì)自然產(chǎn)生壞位。即使在陸地環(huán)境中,也需要ECC來(lái)實(shí)現(xiàn)良好的耐久性和保持特性。在地球上,由于存儲(chǔ)單元中的電荷泄漏而發(fā)生單個(gè)損壞的位;然而,在太空中,翻轉(zhuǎn)機(jī)制更加多樣化。需要考慮多位翻轉(zhuǎn)和功能中斷。不過(guò),與往常一樣,解決方案可以根據(jù)任務(wù)量身定制。在較溫和的軌道上,諸如BCH代碼之類的穩(wěn)健ECC可以處理錯(cuò)誤率,而在更惡劣的環(huán)境中,ECC錯(cuò)誤代碼可能需要與TMR架構(gòu)(或冗余副本)結(jié)合使用以處理功能中斷。
與許多COTS部件一樣,閃存在遠(yuǎn)低于許多任務(wù)所需劑量的劑量下容易受到TID降解的影響。對(duì)于多級(jí)單元(MLC)設(shè)備,這些影響通常更差,其中多個(gè)位存儲(chǔ)在單個(gè)數(shù)據(jù)單元中,并且對(duì)閾值偏移的容差要小得多。因此,空間設(shè)計(jì)師傾向于單層單元(SLC)設(shè)備,這些設(shè)備的操作余量要大得多。TID 容差可能因特征尺寸而異。在許多情況下,可以通過(guò)在器件封裝中添加額外的屏蔽來(lái)減輕總劑量效應(yīng)。
新的前沿
雖然軍用電子不再在創(chuàng)新方面引領(lǐng)市場(chǎng),但不同的技術(shù)使得在需要高可靠性的系統(tǒng)中使用商業(yè)部件成為可能。這一新現(xiàn)實(shí)的一個(gè)意想不到的后果是近年來(lái)資格認(rèn)證流程的變化。過(guò)去,所有進(jìn)入太空的部件都應(yīng)該是防彈的;相比之下,現(xiàn)在設(shè)計(jì)師已經(jīng)掌握了使用商業(yè)零件的挑戰(zhàn)。他們通過(guò)使用大量冗余的設(shè)計(jì)或安裝低成本、短期任務(wù)來(lái)彌補(bǔ)這種轉(zhuǎn)變。這種嚴(yán)重冗余方法的一個(gè)突出例子來(lái)自SpaceX,其龍補(bǔ)給船可能會(huì)失去發(fā)動(dòng)機(jī),但仍成功完成其任務(wù)。此外,低成本/短持續(xù)時(shí)間類別的典型代表是立方體衛(wèi)星的出現(xiàn)。在這兩種情況下,新方法都為低成本,高性能的任務(wù)打開(kāi)了大門,這些任務(wù)有望在未來(lái)幾年內(nèi)帶來(lái)令人興奮的新功能和發(fā)現(xiàn)。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19282瀏覽量
229793 -
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7490瀏覽量
163819 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7494瀏覽量
87934
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論