本應用筆記討論了熱插拔電路在常備系統中的重要作用和電路優化,本文以電信系統作為需要插入背板的微處理器板卡的例子。“始終保持有效運轉”的系統定義為不會因為維護或整修而斷電的系統,本文涉及的“5個9”高度可靠系統幾乎意味著零關斷。如此可靠運行的設備必須依靠熱插拔電路,在不關閉整體系統電源的前提下插入或拔出維護板卡。本文詳細介紹了熱插拔電路,對一些拼湊而成的熱插拔方案加以分析,說明了這些方法中存在的缺陷。本文還闡述了新一代高集成度控制器,這些熱插拔控制器從根本上克服了早期設計的問題。
類似文章于2010年7月19日發表在Planet Analog網站。
?
引言
與其它復雜的多卡系統類似,電信系統是由插入背板的微處理器板卡系統的集合。這類“始終保持有效運轉”的系統通常包括:專用交換機(PBX)、蜂窩基站(BTS)、刀片式中心(BCT)服務器、網絡數據通信和存儲系統。系統一旦上電運行,將不允許斷電中止服務或進行維護。
通常用“5個9”描述這些系統,即99.999%地保持有效運轉,這意味著幾乎為零的關斷時間。對于工作在這一級別的系統,必須允許在保持整個系統工作的狀態下插入或拔出板卡,以便對系統進行維護、升級和配置,有時甚至是在不影響系統工作的狀態下進行系統擴展。
本文討論了板級工程師目前在設計熱插拔電路時所采取的一些拼湊式方案,并在隨后探討了幾種新一代熱插拔控制的創新方案。“熱插拔”定義中重點強調了電壓瞬變,文中介紹了拼湊式熱插拔控制方案的一些負面影響。文章最后介紹了近期推出的熱插拔控制創新技術。
?
熱插拔事件:理解瞬變
熱插拔事件:板卡插入、拔出時產生的浪涌電流尖峰
熱插拔表示在全速運轉、沒有斷電的系統中插入或拔出板卡、電纜或其它裝置。利用合理的設計,帶電插入板卡時不會在電源或系統的輸入、輸出信號上產生任何干擾。
當一個背板插入所有板卡并保持全速運轉時(圖1),背板上的板卡均處于帶電狀態。這意味著每塊板卡的電源輸入端都有一個大電容,而且這個旁路電容處于完全充電狀態。電源輸入端的大電容為電源設計提供了個重要作用:為板卡的下游電路提供穩定的供電電壓,消除旁路電容上的擾動以滿足負載的瞬態供電需求。
如果將機架上尚未充電的一塊板卡插入帶電背板時,將會發生幾種情況。參考圖2,在新插入并開始上電的PCB上,用于旁路和濾波存儲的大電容將呈現瞬間短路并開始充電。充電電荷來自于帶電系統,電容C1、C2和C3 (這些其它板卡上已經充電的電容將開始放電)。這種不受控制的電容充電(或放電)將對新插入板卡上的電容注入較大的浪涌電流。浪涌電流的幅度可能在極短的時間內達到數百安培,取決于實際系統。
隨著電容快速充電,它們將表現為短路狀態,瞬間吸收較大的電流。圖3給出了注入電解電容的浪涌電流的波形圖,以及電容充電時兩端的電壓。從曲線圖可以看出,電流峰值達到了9.44A,從系統吸取較大功率,這將導致背板系統的電容放電。從而使電源電壓跌落,可能造成相鄰板卡復位,引入數據傳輸故障或嚴重干擾其它系統的運行。
瞬間浪涌電流的幅度是負載(早供電)電容的函數,負載電容越大(并且,ESL和ESR越低),峰值浪涌電流越大。
圖2. 電路板插入順序和上電時的浪涌電流
圖3. 注入電解電容的浪涌電流和電容充電時兩端的電壓
?
電壓瞬變的影響可能導致系統失效
任何系統中,這些背板的電源通常提供電流限制。熱插拔過程中所產生的電壓瞬變可能對已插入背板的板卡造成嚴重威脅。浪涌現象會導致背板電源的跌落,而背板電源總線的電壓跌落和/或電源上的脈沖干擾可能造成系統意外復位。不受限制的浪涌電流還會導致元器件損壞:板卡旁路電容被燒毀、印刷電路板(PCB)引線被燒斷、背板連接器引腳和/或保險絲被燒斷(這可能是受到破壞的主要部件)。
背板電源總線的跌落會在要插入系統的板卡電源上產生擾動或脈沖干擾,也會導致相鄰板卡產生復位或影響背板與卡之間的通信(造成通信錯誤)。背板通常采用差分總線(LVDS/LVPECL/光纖通道/其它),必須滿足信號規格以確保通信正常。熱插拔期間由于VCC電源電壓和地電平的變化,會在信號總線上引入共模噪聲。考慮到這一潛在問題,熱插拔控制電路必須采取保護措施,避免在背板上產生強噪聲而導致總線的數據通信錯誤。
另外一個容易忽略的問題是系統的長期可靠性,設計不當的熱插拔保護電路會使電路板上的元器件在長期受到熱插拔事件的沖擊下而損壞。本質上講,每次熱插拔操作都類似于從硅片上“抽取”綁定線,這種周而復始的操作最終會引起毀滅性的破壞。解決這一問題的有效途徑是對熱插拔板卡的浪涌電流峰值加以控制。
?
浪涌電流控制的“拼湊”方案
有幾種已知的峰值浪涌電流控制方式,有些方法基于工程分析,有些方法則僅僅是降低了熱插拔對系統的影響。下面對介紹了幾種拼湊式的實施方案。
?
預充電引腳或“早供電”(例如:電阻法)
一種控制浪涌電流的方法是使用“交錯式引腳”,也稱為“早供電引腳”、“預充電壓”或者是“預先加載”引腳。從物理架構上引入交錯引腳,從而使新板卡正確插入,這種連接方式曾經風靡一時。熱插拔過程中,通過串聯電阻控制浪涌電流。
預充引腳法是一種最基本的熱插拔控制方案,通過一長、一短兩個電源引腳組成,如圖4所示。長電源引腳首先接觸到電源并通過一個串聯電阻RPRECHARGE開始為新板卡的濾波、旁路電容充電。RPRECHARGE限制充電電流。板卡將要完全插入時,短電源引腳接入電源,從而旁路連接在長電源引腳的電阻RPRECHARGE,為板卡供電提供一個低阻通道。信號引腳通常在插入板卡的最后時刻接入。
圖4. 智能連接器提供有效的熱插拔保護
該方案中,電阻RPRECHARGE是保護器件,把浪涌電流限制在不至于燒壞引腳或干擾相鄰板卡工作的水平。有些工程師還會在此架構中對地增添一個電感和/或二極管。
本文將預充引腳法當作一種“拼湊式”方案的主要原因是其不能控制濾波電容的充電速率。這種架構需要考慮兩個關鍵因素:短引腳相對于長引腳的線長,板卡插入系統的快、慢。另外,這是一種機械方案,考慮到連接器的機械容差,完全相同的引腳長度并不能確保接觸時間精確相同。實際應用中用戶會看到上述不同變數。而且,當短電源引腳略長、PCB被快速插入背板時,RPRECHARGE將在輸入電容充滿電之前被短路,因此,這種看似可靠的方案實際存在一定隱患,不能可靠控制浪涌電流。
該架構的另一個關鍵設計步驟是選擇RPRECHARGE,如果電阻選擇不合理,將會直接影響系統工作。預充電阻的選擇必須權衡預充電流和浪涌電流。
最后,交錯式引腳方案需要一個特殊的連接器,這在行業中也是難以接受的。
從上述討論可以看出,預充引腳架構的作用非常有限,也很難達到精確可靠的水準。它對于啟動過程中的電流控制毫無價值,也不具備輸出過壓(OV)和欠壓(UV)監測功能。
熱敏電阻(電流-時間特性)法
另一種熱插拔實施方案是熱敏電阻熱插拔控制法。熱敏電阻為電子元件,阻值在溫度變化時將發生顯著變化(電阻是溫度的函數)。根據溫度變化進行系統調節的電路應用非常普遍。負溫度系數(NTC)熱敏電阻的電流-時間特性取決于其溫度特性,在其應用電路中的功率耗散很穩定。電流-時間特性可以抑制短暫的高壓尖峰以及初始浪涌電流。圖5所示為基于熱敏電阻的熱插拔限流電路,配合一個外部MOSFET使用1。
圖5. 基于熱敏電阻的熱插拔電路1
采用熱敏電阻方案時,需要考慮作用在熱敏電阻上的瞬態峰值功率。設計人員必須考慮電路板環境溫度的變化(覆銅面積和氣流)以及熱敏電阻自身的因素,如果超出其額定電流和/或電壓,則會導致器件損壞。
對于熱敏電阻方案需要考慮幾個因素,例如,在電信系統中,一旦系統交付運營商使用,將不允許更改或重新設計板卡。由此,熱敏電阻可能會引發長期可靠性問題,設計人員必須考慮負溫度系數(NTC)的反作用時間。另外一個關鍵問題是,當板卡反復插入或拔出背板時,熱敏電阻可能沒有足夠的時間冷卻,從而在隨后的帶電插入事件中不能有效地限制浪涌電流。最后,熱敏電阻的特性參數會隨時間變化,這將導致系統的抗沖擊能力下降。
總而言之,該方案在需要根據溫度變化進行調整的系統中能夠提供良好特性(例如,LCD偏置電源),限制浪涌電流。但是,基于熱敏電阻的熱插拔控制器不能滿足系統長期可靠性的需求。
?
分離式熱插拔電路
實現浪涌電流控制的另一渠道是利用幾個分離元件(顯然,多數工程師不會考慮拼湊式方案)。通常,利用分離電路配合獨立的MOSFET、功率檢測電阻及其它偏置元件實現故障保護、斷路器和電流控制功能。分離式熱插拔電路設計非常復雜,而且很難調試(增加了設計和研發時間),而且成本較高、占用較大的PCB面積。
重要的是,分離方案中,無源元件的寄生參數會對熱插拔電路造成較大影響。設計人員必須嚴格控制這些因素。電路中,利用電阻和電容控制電源的上升和下降時間、電流與電流及其它檢測條件。系統設計人員必須嚴格關注寄生參數對電路工作狀況的影響。
討論了上述三種拼湊式熱插拔方案后,我們還有更好的選擇。事實上,最好的解決方案是采用完全集成的單芯片熱插拔控制器,下一節將討論業內最具創新的熱插拔方案,包括MAX5961熱插拔控制器。
?
浪涌峰值電流控制
更高集成度
利用一個電路限制插入板卡的浪涌電流、提供過流和負載瞬變保護、降低系統失效點,工程師可以嚴格控制熱插拔保護板卡的長期可靠性。市場上可以找到高度集成的熱插拔控制IC,有些控制器IC不需要外接檢流電阻。許多IC可以簡單、高效地實現熱插拔保護功能,例如,在單一芯片內支持下列功能:UV和OV保護;過載時利用恒流源實現有源電流限制;電源電壓跌落之前斷開故障負載;利用外部驅動FET構成“理想二極管”提供反向電流保護;多電壓排序;發生負載故障后自動重試。
幾家模擬半導體公司已經推出了各種方案,滿足不同系統的需求。新一代熱插拔IC集成了全面的模擬和數字功能,例如:板卡插入并完全上電后,可連續監測電源電流。連續監測功能可以在板卡正常工作期間繼續提供短路和過流保護,還可以幫助識別故障板卡,在系統完全失效或意外關閉之前撤掉故障板卡。
?
集成ADC的重要性
Maxim、Analog Devices和Linear Technology?均可提供熱插拔方案,器件內部提供數字故障和統計數據記錄。近期出現的一個新名詞是“數字熱插拔”IC,代表集成了電壓和電流監測ADC的熱插拔方案。表1給出了不同供應商所提供的熱插拔IC的性能比較,表中未列出MAX5967,該器件的引腳和功能完全兼容于LTC4215。
表1. 數字熱插拔控制IC對比
? | LTC4215 | ADM1175 | MAX5961 | MAX5970 |
ADC Resolution (bits) | 2 | 12 | 10 | 10 |
Conversion Rate (Hz) | 10 | Not Specified | 10k | 10k |
Automatic or Polled? | Auto | Polled | Auto | Auto |
History "Depth" | 1 sample | 1 sample | 50 samples | 50 samples |
INL | 0.2 LSB, 0.5 LSB | Not Specified | 0.5 LSB | 0.5 LSB |
Full-Scale Error (voltage, current) | ±5.5 LSB, ±5.0 LSB | ±60.0 LSB, ±100.0 LSB | ±10 LSB, ±30.0 LSB | ±10 LSB, ±30.0 LSB |
Interface | I2C/SMBus? | I2C | I2C/SMBus | I2C/SMBus |
High-Speed Voltage (min, max) | 2.9V, 15V | 3.15V, 13.2V | 0V, 16V | 0V, 16V |
GATE Pullup Current (μA) | 20 | 12 | 5 | 5 |
GATE Pulldown Current, Normal (mA) | 1 | 2 | 500 | 500 |
Slow-Trip Circuit-Breaker Threshold (mV) | 25 | 85 | 12.5, 25, 50 (and 8-bit programmable) | 12.5, 25, 50 (and 8-bit programmable) |
Fast-Trip Circuit-Breaker Threshold | — | 115mV | 125%, 150%, 175%, 200% of programmed slow trip | 125%, 150%, 175%, 200% of programmed slow trip |
Load UV Protection | Analog | — | 2 each, 10-bit programmable | 2 each, 10-bit programmable |
Load OV Protection | — | — | 2 each, 10-bit programmable | 2 each, 10-bit programmable |
熱插拔控制IC中嵌入ADC,有助于擴展器件的監測能力并可報告電源狀態以及引起故障的一些關鍵因素。MAX5961還可以存儲幾個毫秒的電壓、電流測試數據,這些數據可以用于后續的故障診斷和分析。
集成ADC還為OEM廠商創造了機會,能夠使其產品更具競爭力。利用先進的電路板管理技術提供系統增值功能:
- 信息采集:設計人員可以根據當前收集的系統關鍵數據構建下一代系統,優化效率。
- 連續監控:對于這些需要始終保持運轉狀態的系統,正常工作期間可能需要連續監測其供電電源的溫度,以記錄一些對應于功率等級的“關鍵統計數據”。這些數據有助于在今后對一些故障狀況進行預測。
- 功率預算:通過讀取以往或當前故障條件的數據,可以判斷是否出現嵌入式板卡的功耗超出了其總功率預算的份額。這種監測對于早期識別不正常的工作條件、減緩甚至消除對系統其余電路的影響很有幫助。
通過I2C連接系統微處理器
板卡微處理器可以通過熱插拔控制器的I2C接口采集一些關鍵的統計數據。通過該接口可以配置熱插拔控制器的工作模式,工作在閉鎖或連續重試狀態;系統管理固件可以據此識別板卡的問題。該接口也是主板向維護人員發出報警信號的渠道,其作用與汽車儀表盤上的引擎故障指示燈類似。
?
結論
熱插拔控制器對于那些始終保持運行狀態的系統是不可或缺的保護電路。發生帶電插拔事件后,跟蹤浪涌電流引起的PCB故障也是非常棘手的設計任務。利用那些拼湊起來的熱插拔方案解決故障問題或者只是很好地解決了其中部分問題,對于系統的長期穩定性而言存在一定隱患,也是工程師無法預測的。
目前,高度集成的熱插拔方案能夠確保系統在帶電插拔的操作中不會引起數據傳輸錯誤或導致系統已插入板卡的復位。這種方案對于保持系統的長期可靠性很有幫助,能夠滿足、甚至優于“5個9”的設計目標。
評論
查看更多