前兩天,跟咸肉大神討論一個問題:即,如果客戶提出苛刻的溫度要求,而我們的電路,不能保證每一個器件的都能滿足整機的溫度范圍。那么我們應該如何實現寬溫度范圍?或者說,我們即不能去承諾這樣的整機指標?還是我們通過什么手段,用低成本的措施來實現滿足可靠性的交付?
一些軍品標準,會要求每臺設備都經過篩選試驗:也就是說每臺設備都經過嚴格的測試,除了器件做早期的老練篩選。整機也做篩選試驗和環境試驗。而一些大規模發貨的設備:會在研發階段做HALT試驗,然后根據HALT試驗的數據設計HASS試驗,對生產環節的設備進行測試。HASS應用于產品的生產階段,以確保所有在HALT中找到的改進措施能夠得已實施。HASS還能夠確保不會由于生產工藝和元器件的改動而引入新的缺陷。
但是一些沒有達到海量發貨的設備,在早期是沒有條件去做HASS試驗的,所以其承諾的整機溫度范圍如果超過器件的溫度范圍,又是如何去保證質量的呢?
首先,是通過HALT試驗或者環境試驗的數據,通過足夠多的樣本數,在大樣本數能夠達到測試條件的前提下,對實際場景能否滿足要求進行折算和評估。但是這里面有概率性風險:例如,我們一個產品在早期,沒有設計HASS試驗的前提下,將設備安裝到西伯利亞的寒冷世界。當時就發生一塊電路板啟動失敗,反復重啟的情況。最后采取更換,故障單板返還的措施。甚至一些大廠,經過大量測試驗證,0~70℃的DDR可以用于更低的溫度,而認為高溫有風險,需要對高溫規格進行降額。(不建議小廠這么做,因為沒有足夠的資源進行試驗和驗證;沒有足夠資源進行單板大批量樣本驗證,以及支持返還進行根因分析。)
其次,一些器件規格不能滿足的場景,可以通過整機方案解決,例如換更高性能的風扇、增加風扇、液冷、加熱器等等措施,可以彌補器件本身溫度范圍不能滿足要求的情況。例如:曾經在華為設計的一款IP Camera,號稱“窮兇極惡”(寬溫度范圍、寬電壓范圍、高規格防雷),為了實現無故障超低溫啟動,原本設計的時候,預留一些加熱器、或者一些加熱電阻,同時修改IPC的啟動策略,由紅外燈先工作一段時間,再啟動CPU工作,保證工作溫度沒沒那么惡劣,是可接受的范圍。
可靠性是一系列方法的整合
可靠性整合是指無縫地、緊密地把不同可靠性方法融合在一起,從而以最小成本得到最佳可靠性。也就是說,可靠性方案是幾種方法協調使用的整體,而不是一堆無序的可靠性任務。
產品由各種部件和組件構成。產品的可靠性在設計生產過程中,涉及到學科主要有:機械學、電子學、軟件、光學、化學,所有這些學科組成了產品。因此應該重視這些學科之間的關系,和總體的效果。我們設計的過程中也應該是考慮更全面,而不僅僅是從某個部件的角度思考,或者僅僅從某個學科的維度去思考和解決問題。
開發部門往往都是從自己部門的學科出發,去思考可靠性設計;甚至更糟糕的是一些大公司從自己部門的利益和KPI去考慮設計。但是客戶要的是完整的產品、并希望產品是各個部件在一起能正常運轉。因為可靠性主要由客戶和最終用戶進行衡量,產品開發人員應該從產品和部件兩個方面進行綜合考慮,從而開發出可靠的產品。
但是有些設計人員,擔心質量事故、擔心考評的黑事件,設計的時候,做可靠性堆砌,不計成本的增加可靠性,過設計、過冗余、過度降額。這就需要:一方面,公司在可靠性和成本雙方面進行引導,同時,需要設計人員能夠具備全面思考產品,能夠站在公司角度,站在客戶角度去思考和設計產品。
可靠性VS成本
可靠性設計可以減少保修成本、使用成本、可以提高客戶滿意度;同時可靠性設計也會造成開發成本和生產成本。在生命周期的各個階段使用合適的方法,我們提高可靠性,到底要實現到什么程度呢?
在保證我們達到業界標準、交付標準、客戶需求等前提下,我們應該是運用可靠性設計實現生命周期的總成本(LCC Life-cycle Costing)的降到最低。
3、軟件幾乎沒有生產成本。因此保修成本和經費幾乎全部用于硬件。如果提高軟件可靠性不能節約成本,那么我們為什么還要提高軟件可靠性呢?
因為:一、事實正面,軟件故障率有可能是硬件的10倍甚至更多。客戶并不區分是軟件故障還是硬件故障。即支持在線升級,任然會造成使用中斷、業務中斷等問題。
二、軟件可靠性方案的好處不在于直接降低成本,而在于減少運作安裝返工率、減小故障維修事件、減輕軟件人員維護工作量。同時提升客戶滿意度。
所以提高軟件可靠性,必定可以帶來成本的節約。
部分文字翻譯自《提高可靠性的50種方法》
-
電路
+關注
關注
172文章
5928瀏覽量
172392 -
可靠性
+關注
關注
4文章
265瀏覽量
26755
原文標題:可靠性VS成本
文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論