2004年加入華為后,我連續做了14年的硬件,還算做了一些讓人滿意的單板,也有幸參與海思芯片的設計和開發,見證了網絡芯片的成長。然而這當中也沒什么高深的大招,只有一點一滴的積累。
10年整理600多頁的“紅寶書”
有人說,做硬件很容易,會擰螺絲會連線畫原理圖就行,但在我看來,這充其量只是連線工程師、畫圖工程師,不能叫硬件工程師。硬件工程師要懂的東西很多且很雜,PI(電源完整性)、SI(信號完整性)、時序……小到電阻電容,大到協議標準,遇到問題要能夠有自己的判斷而不是茫然無措。當時我們的老大說過一句話,“只要是看得見的,硬件都要管”,言下之意是硬件工程師要了解和單板硬件相關的所有領域,并對相關的技術問題做出判斷,現在看來就是整個大硬件域。
在加入華為前,我已經在廣州的一家公司做了兩年的硬件了,當時做的單板規模很小、很簡單,遠不及華為單板的規模和專業性,接觸華為單板后發現自己了解的那點硬件知識真不夠用,于是就一邊硬啃各種文檔資料,一邊追著專家請教。在工作中逐步學習PI/SI,學習高速設計,學習工藝,學習結構,學習散熱,學習可靠性,總之只要和硬件相關的都會去學。雖然不如該領域工程深入,但也能夠和對應領域工程師無障礙溝通并共同解決涉及的問題,到后來無論是做單板還是看別人的單板都會游刃有余。
這么多年的工作讓我養成了一個習慣,在看器件手冊和技術文檔時,如果看到一個沒見過的技術名詞,就會立刻去google一下。即便是看不明白,也會硬著頭皮從頭到尾讀一遍,在后續的工作中再去慢慢揣摩,同時會把在這個過程中看到的相關技術信息摘出來,專門放到兩個文檔中(一個word文檔,信息記錄較詳細;一個是excel,方便查閱),這樣后續查閱就不需要再翻箱倒柜了。新知識、新技術永遠在不停地發展,目前我的“紅寶書”還在陸續更新中。10年來,我的word文檔已經足足有六百多頁的干貨了,細看下來,除了技術解釋,標準摘要外,典型設計、設計中易犯的錯誤、各種器件的設計注意事項、等等內容也收集在里面。
除了查閱的便利外,這個過程其實也是我個人學習 總結的一個過程,現在只要是我的電腦開著,我的這兩個文檔就是開著的。我也無償把紅寶書分享給一些有需要的同事,希望也能方便他們的工作。
華為“兵王”:從“單板王”到芯片行家 靠的是腳踏實地
問題攻關幾乎成了我司硬件人員的成長必經之路,既磨練意志也開闊眼界,這十幾年我主導和參與過的攻關不計其數。
幾年前帶領過一個芯片接口誤碼攻關,這個攻關在我投入前已經攻關了月余,完全是被供應商牽著鼻子走,不斷給他們測各種數據,然后等他們答復,反復很多次卻沒看到任何實質性的進展。
加入并帶領攻關后,我先將已有的數據梳理了一下,然后和供應商交流了幾次,基于這些數據我判斷他們的方向是錯誤的,但他們卻堅持己見,認為是我們提供的參考時鐘抖動有問題,但從測量數據上分析抖動是正常的,這樣一來攻關便陷入了僵局,于是我決定撇開供應商進行問題攻關。
經過對問題的分析和測試,我們判斷DDR控制器的讀寫采樣窗口小導致了這個問題,進一步設計實驗發現是“讀”方向有問題,但是窗口到底有多大,示波器無法準確的測試。通過和海思交流,我們利用芯片已有的寄存器很巧妙的設計了實驗,準確的測定了DDR接口的窗口大小,出問題時的窗口確實很小,可是奇怪的是控制器啟動后都會做讀寫窗口的掃描,理論上不應該出現這個問題。于是我把DDR的手冊又啃了一遍,分析了DDR的窗口掃描算法,結合示波器的測試,最后發現是供應商集成的DDR窗口掃描算法太簡陋,掃出來的窗口比實際的大很多,并且我們使用的某廠家DDR在高溫下窗口會縮小,至此整個問題水落石出。針對此問題供應商的算法已無法修改,因此我們設計了一個巧妙的軟件算法對窗口進行補償,同時更換某廠家最新版本的DDR芯片,徹底解決了這個問題。
在最終問題定位之前,供應商始終認為是我們的問題,如果繼續由他們控制整個攻關進程,問題定位結果必然跑偏,因此攻關中要有必要的堅持。
最近一次問題攻關在上個月,單板邏輯的兄弟遇到刷表出錯的問題跑來問我,當時由于工作太忙無暇顧及,幫忙出了些點子就放在一邊。過了幾周正在成研出差突然就被呼到一個電話會上,原來這個問題一直沒解決,還愈演愈烈了。第二天和邏輯兄弟走讀了一上午的代碼沒有發現問題,一下進入了死胡同。這一天剛好是周末,實驗室很安靜,完全沒了思路之后決定起來走走,繞著整層樓繞圈,同時在腦子里將這個問題現象串一遍。兩種類型的單板,C板A片出問題,X板B片出問題,幾乎完全一樣的硬件設計,邏輯設計幾乎完全一樣,差別只是邏輯中狀態機判斷條件C板B片在前,X板A片在前,問題似乎就在這里,但是代碼上卻看不出問題,會不會是兩塊單板上兩個芯片接口走線的延時差導致出問題?立刻回去查看PCB圖,果然是這樣,兩顆芯片的延時剛好一個是A片長,一個是B片長,至此徹底打開了攻關思路,經過一周的艱苦攻關徹底解決了這個問題。
攻關最常遇到的情況是感覺好像所有招使盡了卻難前進半步了,這種時候需要放松休息一下,攻關和創作藝術品一樣,需要靈感。
平時的工作中由于時間關系,對于很多接口協議/硬件標準等了解并不深入,但到了攻關的時候為了解決問題,就必須沉下心來硬啃文檔,所以每次攻關結束,都會發現自己在某些領域又深入了很多,或者是對協議標準,或者是工程領域最新的技術或問題,因此雖然過程很艱辛,但對于攻關還是樂此不疲。
單板要是做砸了,以后沒人敢用你
生活中我是一個特別仔細小心,甚至有點強迫癥的人,一件事件經常會反復確認,在工作中也是如此,對于關鍵問題會反復確認和分析,確保無誤。以前跟海思一個項目經理一起做芯片,我從別人那聽到他評價我時說,“你別看這個楊勇長得五大三粗的,但心思卻非常細!”
硬件絕大部分的問題攻關過程艱辛,但最終的問題根因往往很簡單,有的甚至很低級,一分鐘犯的錯誤要用千百倍的時間來解決,一個連線錯誤就要導致單板花三個月來重新改板,成本巨大。剛入職路由器時,硬件老前輩給我們新人說,“優秀的硬件工程師就是要一根飛線都沒有”、“好的單板就是你的品牌,板子要是做砸了,以后是沒人敢用你”。因此從做單板以來一直都謹記前輩的教誨,小心翼翼、戰戰兢兢,用如履薄冰的態度做單板設計,不放過設計中的任何一個細節,有疑問的地方都是多次確認。40Kpin規模單板的原理圖和PCB,一遍一遍,一根線一根線地點著看,查完原理圖查網表,甚至連原理圖設計工具的提示信息也每條都確認。從我的角度來說,要做一個好的單板其實沒有捷徑,就是每根線都點到,每個器件都看到,每一處設計都分析。
當時我所做的單板是路由器規模最大的一塊單板,編譯網表時原理圖設計工具給出的和notes有幾千條,我們也堅持每條都點一次確認一下,而且是編譯一次點一次,有時感覺看得都有點想吐了,但仍然堅持看完。工作辛苦細致一點,風險就可以小一點,萬一這些無效問題中隱藏著一條真正的問題沒被看到,那就意味著單板可能要改板。曾經有QA問我如何保證單板質量,我給他開玩笑說“檢視,檢視,再檢視”。
因為看得很仔細,以至于當時原理圖設計工具的一些問題都被找了出來,雖然過程很辛苦,但是單板成功了就是對這些辛苦最大的獎勵,這塊單板是路由器當時最復雜的單板,如今成了路由器發貨時間最長,賺錢最多單板之一,前年才終止發貨。
我覺得,硬件工程師對待每一塊經自己手設計的單板,都要當藝術品一樣,設計規范整齊,精益求精。好的單板設計看起來應該給人一種很舒服的感覺,連線整齊,命名規范,標示詳細,看一眼網標名稱就知道這個信號是什么,從哪來到哪去,方便檢視還不容易出錯,原理圖中詳細標注設計細節,這樣檢視原理圖就不用再去翻詳細設計報告和數據手冊。
這么多年來,但凡經我手的單板從沒出過問題。我覺得也許強迫癥是硬件工程師的必備素質之一。
轉戰中國芯
作為硬件工程師,除了做單板我還有幸參加了網絡芯片的設計和驗證工作,見證了網絡芯片設計/驗證的團隊從無到有,從涓涓細流到如太平洋般寬廣的成長。
在交付完路由器最復雜的單板之后,我被抽調去參與路由器40G芯片設計,承擔40G芯片的硬件和工程需求的梳理及驗證方案的設計,工作從單板硬件轉到芯片設計有一定的跨度,有很多芯片板級應用方案、需求分析和決策,每天都是忙于各種硬件方案的分析設計,追著產品的SE和芯片SE確認問題,硬啃最新的芯片工程技術,決策芯片的硬件和工程需求。當時加班多到領導都看不下去了,唯一一次過年沒有回家就是這次支持40G芯片回片的驗證測試。
40G芯片的成功使華為核心路由器有了中國芯,全面具備了趕超世界一流IP芯片的能力,使路由器硬件競爭力顯著提升。能有幸參與這種劃時代的項目是人生最寶貴的經歷。
現在我的工作也是一半單板交付,一半芯片開發,涉及網絡產品線的所有網板和大部分芯片,隨著技術的發展,芯片的設計和應用已經全面挑戰工程技術極限,參與芯片設計讓我能夠接觸到最新的技術,不斷更新自己的知識體系。在華為工作14年大小獎勵也獲得很多,金牌個人、金牌團隊、總裁獎、明日之星等等,現在公司越來越重視專家的價值,在職級崗位等方面都給予了更大的發展空間,我也就更堅定了專家這條路線。公司重視,專家更應該回歸到專家應有之道,在具體的技術領域要持續耕耘,做廣做深,既能夠承擔具體的開發工作也能夠洞察業界的發展方向。現在的我在做好單板和芯片的同時,也適時地抽身出來學習,期望能站在更高的視角來看待硬件領域,為硬件將來的發展做出更大的貢獻。
-
芯片
+關注
關注
455文章
50728瀏覽量
423182 -
華為
+關注
關注
216文章
34417瀏覽量
251516
原文標題:從“單板王”到芯片行家--華為兵王:腳踏實地方能成功!
文章出處:【微信號:eetop-1,微信公眾號:EETOP】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論