部分應用要求電子產品運行的溫度高于該器件規定的最高工作結溫。油井攝像頭設計就是一個很好的例證。
任何電子器件的使用壽命均取決于其工作溫度。在較高溫度下器件會加快老化,使用壽命會縮短。但某些應用要求電子產品工作在器件最大額定工作結溫下。以石油天然氣產業為例來說明這個問題以及解決方案。
一位客戶請求我們 Aphesa 的團隊設計一款能夠在油井中工作的高溫攝像頭(如圖 1 所示)。該器件要求使用相當大的 FPGA 而且溫度要求至少高達 125℃——即系統的工作溫度。作為一家開發定制攝像頭和包括 FPGA 代碼及嵌入式軟件在內的定制電子產品的咨詢公司,我們在高溫工作條件方面擁有豐富的經驗。但就這個項目而言,我們還得多花些精力。
該產品是一種用于油井檢查的井下雙色攝像頭(如圖 2 所示)。它能執行嵌入式圖像處理、色彩重構和通信。該系統具有存儲器、LED 驅動器和高動態范圍 (HDR) 成像功能。針對該項目,我們選擇使用賽靈思提供的 XA6SLX45 器件(Spartan®-6 LX45 車用器件),因為它具有寬泛的工作溫度范圍、穩健可靠、封裝尺寸小、擁有大型嵌入式存儲器和大量單元。
該項目非常具有挑戰性,也有大量樂趣。下面介紹我們如何完成該項目,首先回顧一下溫度的部分概念,包括結溫、熱阻和其他現象。我們將了解器件中溫升的原因并列出我們的解決方案。我們還將應對可能的熱點問題并提出相應的解決方案。
在這個特定項目中,熱電冷卻方式的使用受限,我們不得不尋找其他解決方案。
溫度變化
電子器件通常會指定最大結溫。但令人遺憾的是系統設計人員關心的是環境溫度。環境溫度和結溫的差異將取決于封裝傳遞熱量的能力以及冷卻系統將該熱量散出系統機箱的能力。
熱阻是一個熱屬性,也是衡量給定材料阻礙熱量流動的幅度的指標。因為熱阻的存在,熱流通過的組件的內外側溫度會有差異,正如電流的存在造成電阻兩端的電壓不同。對機身內外側溫差 20℃ 的情況,最大結溫為 125℃ 的器件能夠在高達 105℃ 的環境下工作。熱阻的表達方式是℃/W,即耗散 1W 熱量時內側和外側的溫差即為熱阻。熱阻是一種熱屬性,用來衡量給定材料阻礙熱量流動的幅度,這一關系以公式表示即為圖 3 所示。
耗散的熱能取決于器件、電路、時鐘頻率和運行在器件上的代碼。器件內部(結溫)和所在環境(環境溫度)之間的溫差因此取決于器件、代碼和工作原理圖。
常用冷卻解決方案
在大多數設計中需要冷卻的地方,設計人員使用無源冷卻(散熱器通過增大空氣接觸表面,幫助將熱量散發到空氣中)或使用有源冷卻。有源冷卻解決方案一般通過強制氣流,幫助更換用于吸收器件上熱量的冷空氣。空氣吸收熱量的能力取決于空氣與器件之間的溫差以及空氣的壓力。其他解決方案包括液體冷卻,用液體(一般是水)取代空氣,可實現更高的散熱效率。空氣或流體吸熱的能力由圖 4 給出的熱吸收等式決定。設計人員常常使用的最終方法是熱電冷卻,即借助珀爾帖效應 (Peltier effect)(通過在連接到半導體樣品的兩個電極間施加電壓來形成溫差)來冷卻冷卻板的一側,同時加熱另一側。雖然這一現象有助于把熱量從待冷卻的器件上帶走,但珀爾帖冷卻有存在另一大不利因素:它要求大量的外部功耗。
在我們的案例中,氣流不是解決方案,因為機箱中的空氣數量有限,空氣溫度會迅速達到均衡。水冷也不可能,因為水源和工具之間距離很長。因此對我們而言,珀爾帖效應是唯一的冷卻解決方案。因為環境溫度是固定的(我們不能像圖 3 的公式一樣為大量液體加熱),熱電效應冷卻器實際上會降低電子產品的溫度。令人遺憾的是,由于冷卻裝置需要大電流,而且需要用超長的導體將表面與工具相連,實際上只有有限的電流可用于冷卻,而且只能實現較小的溫差。
此外,由于我們的裝置是一個攝像頭,畫質會隨溫度升高急劇下降。因此我們必須優化我們的冷卻策略,盡量為圖像傳感器降低溫度,而不是 FPGA、存儲器、LED 驅動器或電源電路降低溫度。
由于珀爾帖效應只能選擇用于冷卻圖像傳感器,用于冷卻 FPGA 幾乎沒有可能,所以我們唯一的選擇是降低 FPGA 內的峰值溫度。
熱點的原因
和不斷上升的溫度在數字器件中有三個功耗來源:動態、靜態和焦耳效應。動態功耗是在門觸發時用于為走線電容充放電而消耗的電力。它與時鐘速率和總電容大小成正比。靜態功耗是器件類型、核心電壓和技術的函數。該功耗因內核或 I/O 的耗電而產生。
當熱量在空間中的某一點產生時,它將向周邊傳遞,導致周邊區域升溫。如果周邊區域不是熱源,則熱量會散開,溫升有限。只要等上足夠長的時間,溫度最終會在整個器件中均衡化。如果周邊區域是其他熱源構成的,因為每個熱源都會給另一個熱源帶來熱量,溫度就會凈增長。
如果許多熱源集中在一小塊面積上,則這個面積的溫度會上升得比其他地方快,導致熱點產生。
由于器件的結溫受限,實際上最熱點的溫度不應超過最大結溫。在知道器件的功耗和封裝的溫度后,所有我們能估計的平均結溫。
最后一個熱源與電流在導體中流動產生的焦耳效應有關。
如果超過最高溫度會發生什么情況?
隨著工作溫度升高,器件的使用壽命會下降,部件會老化得更快。某些老化過程,如電遷移和電腐蝕只會在較高溫度下發生。電遷移發生在有濕氣和電場存在的條件下。此時導體的原子會以離子形態從他們的初始位置移動,在另外的地方復位,留下一個空隙。這個空隙會減小該位置導體的有效寬度,造成該位置電場增強,從而誘發更多的電遷移。這種鏈式反應會在原子移走的位置導致裂隙(開路)或在原子重定位的地方導致短路(樹突)。為數不多的幾層水分子足以引發金屬的離子化過程,觸發電遷移。這一現象會隨著溫度升高明顯嚴重化。
像鐵生銹這樣的腐蝕現象涉及濕氣和有害氣體。半導體材料封閉在其保護性封裝中。這種封裝一般對濕氣有高吸收性,但制作所用的材料不會輕易地產生腐蝕性離子溶液。這種腐蝕大多數情況下會給引線框和封裝接線造成不利影響。最重要的有害材料是硅鈍化層中所含的磷,以及半導體制造工藝或封裝工藝所殘留的部分污染物。在運輸、焊接和裝配過程中接觸人體皮膚和其他化學品是導致污染的有害原子的其他可能來源。
當異質材料連接在一起時,較便宜的材料相對于較貴的材料容易發生腐蝕(電化腐蝕)。這類型的腐蝕是隨時間推移性能降低的又一個原因。
在超過結溫溫度的情況下,無法保證器件的使用壽命,可能會大幅度縮短。如果溫度持續增長,該器件可能會立即失效。
器件的性能也取決于速度。器件在較高溫度下速度會下降,因此它們的最大時鐘速率會降低。
之所以把 Spartan-6 XA(汽車級)FPGA 的最高溫度限定為 125℃ 是出于最低使用壽命要求(可靠性考慮)和有保證的時鐘頻率能力(性能要求)。其他原因包 RAM 單元漏電和因這種漏電造成的位錯誤。
多種解決方案
為克服我們的油井攝像頭設計的各類難題,我們實施了多種解決方案。
其中最重要的決定之一是選擇大小合適的器件。越大型的器件的靜態功耗越大,但有利于器件的散熱,避免形成熱點。經認證用于汽車用途的器件即使在高溫下也具有較長的使用壽命,因此對于使用壽命要求不高的工業應用而言,更是一款合適的解決方案。我們已經評估了 XA(車用)系列的 LX25 和 LX45 器件免溫度周期過程中發生板層分離問題中的代碼并測量了器件殼體的總功耗和溫度。有時如果峰值溫度較低,提高器件平均溫度也可接受。我們還在加速老化測試中評估了使用壽命。
我們的下一個設計選擇是為器件使用設定限制。為減少器件耗散的熱量,我們盡可能地避免使用邏輯單元和存儲器。器件未使用得到部分會消耗靜態功耗,但不會消耗動態功耗。
我們還施加了時鐘門控。因為動態功耗取決于時鐘速率,我們可以使用時鐘門控抵消未被使用的模塊的動態功耗。如果時鐘樹未觸發,器件該部分的功耗就會降低。
我們還可以將我們使用的 I/O 數量保持在最低水平。這樣也可以降低 I/O 模塊的功耗。
因此,通過把部分 I/O 用作虛地,我們縮短了器件內部電流的傳輸距離,從而降低了電源走線的焦耳效應。虛地也有助于把熱量傳遞到地面。
因為我們不想使用所有的 I/O 和所有的邏輯單元,我們選擇把這個設計分布到兩個 FPGA 上(圖 5)。這樣就可以讓熱量在兩個單獨的位置耗散。
我們還使用多個接地面。這一技巧有助于把熱量從溫度較高的地方向溫度較低的地方傳遞,并提供額外的熱容量。為開發板的可靠性起見,在設計熱平面時應考慮避。
一個重要步驟是優化我們的代碼以
降低時鐘速率。降低時鐘速率可以降低功耗,但也可以讓器件在更高的溫度下運行。作為例子,我們評估了慢速并行設計和快速流水線化設計之間的權衡取舍。
為提升設計性能,我們確保在最終裝配前干燥各個組件并覆蓋一層能抵御濕氣的保護層。另在高溫下器件會老化得更快。可以使用產品認證來衡量設計的器件實際使用壽命隨溫度變化情況。
我們也在生產中采用老化流程來預老化器件,移除那些老化速度看似比其他部件更快的部件(早期失效),從而只保留下最好的部件。
對我們的設計流程同樣重要的是使用雖然按規范其結溫不得超過 125℃。此外我們還努力做到了無需熱電冷卻也能在 125℃ 下正常運行。
以恢復或至少檢測存儲器單元中或通信中的位錯誤。如果狀態機以未使用的狀態結束,也可以恢復。
我們發現在開展我們的設計時使用賽靈思功耗估算器 (XPE) 是良好的開端。TVivado® Design Suite 為采用較新型的器件的設計提供功耗估算工具。不過測量真實器件上的功耗和比較不同版本的代碼經證明是最理想、最準確的做法。
非熱電冷卻
綜合運用上述技巧,循環冗余檢查 (CRC) 和其他類型的錯誤檢測和糾正措施。我們在設計里的各個位置使用這些技巧,我們得到了一款能夠工作在 125℃ 環境溫度下且具備 SDRAM 管理、通信總線和圖像處理能力的攝像頭,
評論
查看更多