【經驗】把惱人的硬件故障經驗變成學習機會

2016年12月22日 10:48 來源:eettaiwan 作者:Bill Schweber 我要評論(0)

標簽:筆記本電腦(48131)硬件故障(8227)

做出測試或是故障排除的假設很容易,但我們可能沒有時間或工具去找出導致系統出問題的實際原因…

我曾經有過一臺用了很多年的迷你筆記本電腦,那臺惠普(HP) Mini 110被歸類為「小筆電(netbook)」,雖然是PC家族里幾乎已經消亡的一個類別,但在將近一年前還能用,直到在幾個月中間連續出了兩次問題;現在那臺1.2公斤重的裝置已經被換掉了,但我從它身上看到了堅固的子系統設計以及產品壽命測試。

到底發生了什么事?首先是電池組掛了,所以那臺小筆電得一直連著AC變壓器;但是因為筆電的設計本來就是透過電池供電運作,它們的電源供應器之大量儲存容量非常有限,而且幾乎無法直接透過電源線取得電力。

因此,盡管是非常小的、原本注意不到或根本不是問題的AC瞬變(它們非常令人驚訝地很常見),也會導致系統關機──這真是很令人抓狂!但在線商店販賣的可替換電池組要價100美元(而且是來自質量不知道有沒有問題的白牌供貨商),實在不是個好選擇。

接著又出了個問題,是小筆電的Windows XP操作系統出現某種系統錯誤(至少我認為問題在此),導致硬盤機一直在尋找某個顯然不存在的東西;我安裝了一些磁盤清理以及追蹤診斷工具,但最后發現那好像是一種登錄檔(registry)的問題──我猜的,但無法驗證──導致硬盤機持續存取,而我完全無法做任何事來排除故障。

連續不斷出現的操作系統錯誤,導致硬盤機轉個不停;我可以清楚聽到磁盤驅動器一直在讀取,而機器上的讀取燈號也一直亮著,偶爾會閃爍一下。因此小筆電的執行速度慢到像烏龜爬,得花好幾秒才能成功切換窗口或是對指令做反應,要開個檔案更是得花好幾分鐘;顯然磁盤驅動器已經完全被執行中的任務占據,并占用了所有的系統資源。

而這幾乎永無止盡、高占空比的磁盤存取活動告訴我一件事:其內建硬盤機一定有非常堅固的機械電子甚至散熱設計;根據我的非科學估計,那臺硬盤機光是過去一年的運轉次數,應該就已經超越正常使用的好幾輪生命周期,但它還是堅持不懈。而這個假設的軟件錯誤,讓我能直接聽到而且看到硬盤機的全套動作,讓我對它的開發廠商肅然起敬(我要再來打開那臺小筆電看看是哪家)──我好像自愿幫他們做了產品生命周期測試。

當然,我對于硬盤機堅固程度的猜測也可能只是一廂情愿的想法;或許真正的問題不是軟件故障導致硬盤一直在找不存在的某個東西,而是硬盤機本身凸槌,有其他導致硬盤機持續嘗試讀取某個磁道、但又不成功的問題。

如果我們能從這里學到什么關于故障排除的教訓,就是做出假設很容易,但有可能會被那些假設的邏輯導向不正確的結論,特別是當我們只有針對實際問題所在的間接推測或稀少證據;因此,我假設登錄文件錯誤是導致硬盤機持續搜尋的問題根源,可能只是個巧合。

我嘗試將那些狀況視為學習經驗,打算把那臺故障小筆電大卸八塊、看看其硬件內部結構,這樣就能知道更多信息;我對于各種散熱片、熱管、均熱板或其他散熱技術特別有興趣,因為那臺小筆電運轉時都很燙,而且風扇也很努力地轉。在此同時,我還想看看它的硬盤機是有多特別──如果我看得出來。

你也有遇到過硬件故障的惱人問題嗎?那些問題是否為你自己的設計帶來一些啟示?或者是你有沒有看過一些在某些部分過度設計、只為了補償其他部分設計弱點的產品?歡迎與我們分享你的經驗與故事!

編譯:Judith Cheng

(參考原文: Software Bug Induces Extreme Hardware Test, Maybe,by Bill Schweber)